的观点

数量:11 (1)DOI: 10.37532 / 2319 - 9822.2022.11 (1) .195

探索月光环轨道转移多目标强化学习(MORL)

菲利普·沃尔特*

主编,《太空探索,联合王国

*通信:: 菲利普·沃尔特主编,《太空探索,联合王国;电子邮件:walter.F@gmail.com

收到:2022年1月3日,手稿。tsse - 22 - 63519;编辑分配:2022年1月5日,PreQC不。tsse - 22 - 63519 (PQ);综述:2022年1月15日,质检不。tsse - 22 - 63519 (Q);修改后:2022年1月17日,手稿。tsse - 22 - 63519 (R);发表日期:2022年1月27日,DOI: 10.37532 / 2319 - 9822.2022.11 (1) .195

引用:Albertella L,最初的轨道确定和相关地球轨道物体的光学观测,英国,J空间空洞。2022;11 (1).194。

介绍

这个集合的目的是处理月地空间动态的困难。月系统可能被认为是一个动态的实验室,具有不同寻常的特性。一方面,我们可以看到两者之间的大质量比。大部分的月亮,它的轨道,其接近太阳,和其表面的混沌性质。小实体及其行为的动力学(人为和非人为)相反,月地位置,至关重要的测试。首先,我们承认,共同尝试研究月球表面松开和载人任务,以及研究月球内部保持月球网关。

Low-thrust轨迹是解决多目标高维优化问题。此外,硬件规格、任务目标、任务限制,部署情况下,权力的限制和其他作战需求都有影响的可用性和属性可能的解决方案。理解为SmallSats low-thrust轨迹的设计空间飞船和任务参数增长允许众多目标之间权衡,如降低散度的参考轨迹和限制推进剂质量需要长度超过可容忍的飞行。伴随帕累托前沿,代表没有主导解决方案集,经常被用于研究多目标问题的解决方案。开发点解决方案,分为多目标解空间是一个一步发现全球帕累托。

这些点的解决方案提供了广泛的见解轨迹设计空间,他们可以用来构造的局部最优,甚至全局最优的解决方案。然而,考虑到复杂的月地空间重力环境,创建一个似是而非,low-thrust路线可能是耗时和成本计算。

机器学习是一个很好的竞争者提供综合解决方案,高维空间的解决方案。深强化学习(DRL)更受欢迎在任务设计师在设计高维情况下恢复困难的解决方案。多目标深度强化学习算法提供了一个快速的方法来找到不同几何形状和目标优先级的解决方案,同时使用更少计算资源和时间。

使用MRPPO,许多政策同时教,每个都有不同的权重比例相互冲突的目标。每个策略是教发展独特的控制方案基于奖励函数分配:加权的混合目标直接对目标航天器任务轨道最小化偏离参考轨迹和惩罚推进剂质量利用率。

摘要MRPPO用于培训政策引导low-thrust-enabled SmallSat通过三个不同的传输设计场景在地球和月球CR3BP:(1)从L1李雅普诺夫轨道L2李雅普诺夫轨道的能量,(2)从光环轨道北部的一个L1, L2南部光环轨道的能量,和(3)从L1北部光环轨道高能量L2南部光环轨道。

由于可用性动力系统理论的见解,第一个场景作为验证测试;特别是,一个已知的自然关系周期轨道。第二个和第三个案例呈现更为复杂的评估没有明显的自然的答案。培训政策评估在一个共享设置的摄动情况下开始随机生成的初始轨道周期为每一个轨迹设计场景获得洞察每个控制方案的属性。地区的多目标空间调查使用的最大,最小,意味着各种属性的值。洞察所需的推进剂数量、飞行时间、和轨道几何正在迅速获得通过自动生成多目标解空间的一个子集;这些知识在航天器的发展是至关重要的。

人造物体的动力学研究的框架CR3BP。所有的科学家,包括Cipriano,研究人工CR3BP场景中对象的行为。欧洲航天局选择了LUMIO(月球流星影响观察者)项目为未来实现的一部分SysNova竞争“月球勘探立方体卫星”和Cipriano和他的同事们现在。概念尤其值得注意,因为它不仅地址天平动点的轨迹设计轨道在月系统的任务,但它还计划检测流星体的影响在月球远地端全,除了地面观测。

月系统法律流程外包业务的重点。扩张状态观测器,光环轨道扰动,以及潜在的注入错误可能都被用来演示如何计算SRP。主要目的是提高位置控制和管理。CR3BP,一个重要的主题的机构,Lizy Destrez,和她的同事们很难聚在一起。最后,这将显示如何定位架和heteroclinic联系,除了月球网关Heiliger的功能。CR3BP SRP加速度是恒定的,坐落在平面和李雅普诺夫的轨道之间。这些动态走廊出现由于太阳帆的偶然的应用自然交通网络。

平衡的点,周期轨道,和双曲不变流形自然月CR3BP动力特性经常集成到轨迹规划过程。CR3BP描述多体系统的五个平衡态。

L1-L5存在的点是整个系统。几个周期轨道家庭CR3BP附近发生。月L1和L2点平衡平衡分,有利条件,是非常重要的。品质长期飞船安装。例如,月球网关目前计划在2025年完成。L2南部光环的行星轨道。月系统、MRPPO MODRL算法,采用不同的政策在三个平动点轨道转移场景。多目标解空间的一个子集low-thrust-enabled SmallSat连接通过low-thrust转移两个周期轨道和指定的形状显示使用这种方法。作为一种解决方案空间,八个政策被教导在L1李雅普诺夫轨道的L2李雅普诺夫轨道转移。然后,使用这种方法,检查两个更复杂的场景,集中退出一个L1达成L2光环轨道北部和南部光环轨道在不同的能量。

的观点

探索月光环轨道转移多目标强化学习(MORL)

介绍

表的内容

数量:12

数量:11

数量:10

数量:9

数量:8

数量:7

数量:6

数量:5

数量:4

数量:3

数量:2

数量:1

谷歌学者引用报告

引用次数:214

编入索引中

对于作者

图书馆员

乐动app开放存取期刊

《太空探索ISSN(打印):2319 - 9814ISSN(在线):2319 - 9822

的观点

探索月光环轨道转移多目标强化学习(MORL)

介绍

表的内容

引用次数:214

编入索引中

对于作者

图书馆员

乐动app开放存取期刊

《太空探索
ISSN(打印):2319 - 9814
ISSN(在线):2319 - 9822