猿问

机器人机器学习模型的正确方法

我正在寻找使用哪种模型或方法的起点。案例如下:

一个有 9 个输入的机器人:

  • -6个提供距离的传感器

  • -检测崩溃的传感器

  • -左电机当前转速

  • - 右电机的当前速度

输出:2 个数字(或 2 个布尔值)控制 2 个电机(左前和右前)

现在我正在考虑让机器人想办法不崩溃。我将 6 个传感器连同一个“有效/无效”作为数据输入模型然后训练模型以找出当传感器值低于某个数字时电机需要比另一个更快避免崩溃输入。另外,我需要告诉模型需要避免崩溃标志。

现在作为平台,我正在考虑一个树莓派,可能有一个天蓝色的连接,所以我可以使用我想要的任何模型

但我在寻找哪种型号?它需要从连续数据中学习。尝试一些东西,写回去,从中学习,然后尝试其他东西。输出可能需要多回归或多二进制。

输入也是如此,多个输入。需要已经从新的数据点中学习。任何想法?


繁花不似锦
浏览 117回答 1
1回答

拉莫斯之舞

您正在寻找强化学习。有很多关于机器人或游戏 AI 的文献。它是如何工作的,就像你说的那样,持续不断。它(代理)有一个环境(传感器,当前速度),他可以执行将导致环境反应的动作(控制电机)。通过给定的操作,它将获得奖励,例如distance from object < before=> +1 否则 -1。你明白了。通过尝试,失败,它会创建自己的策略(它的行为)来最大化奖励。加固中最常用的算法是Q-Learning(其深度学习方面称为 DQN)。这是一篇可能与您的问题有关的论文:链接
随时随地看视频慕课网APP

相关分类

Python
我要回答