人工智能辅助科学家对昆虫等微小生物分类,准确度可达91。4
作者/雪松
在生物多样性逐步减少的今天,科学家亟须对未命名生物进行编码分类。昆虫等无脊椎动物在未命名的900万物种中的生物量占比可达90%以上,然而科学家对无脊椎动物多样性的探索现状,可谓沧海一粟。
该工作的主要障碍在于:昆虫样本形态较小、种类复杂且数量庞大;传统分拣技术需要基于形态学的手动处理,速度太慢;基于元数据库编码的分子技术难以获得可靠的丰度信息。
因此,德国研究人员设计了一个对小样本进行全自动筛选分类的机器人。实验结果表明,基于一个初步的神经网络,该机器人对各类昆虫分类的平均精度为91.4%(75-100%);随着更多的图像被用于训练,该神经网络预测精度将进一步提高。在未来,该技术将提高微小生物分类编码工作的分类精度,缩短分类时间,极大提高工作效率。
文章以「DiversityScanner: Robotic discovery of small invertebrates with machine learning methods」为题,于2021年5月17日发表在biorxiv预印本平台。
该文详细报道了一种快速准确的昆虫分类机器人。该机器人配备了两个带有定制镜头的高分辨率镜头、合适的LED照明和图像识别软件。此外,还安装了基于吸泵的运输系统,可将检测到的昆虫转移到标准96孔微板中。首先,机器人对小样本进行排序;然后,使用卷积神经网络( convolutional neural nets,CNN)对混合样本进行检测,并对每一个样本进行单独拍照分析;最后将每个样本移动到96孔微板中,进行DNA测序;测序结果与前面的照片相对应,生成新的DNA条形码(DNA barcod)。
图1:昆虫分拣机器人(The insect sorting robot )。(来源:论文)
机器人系统可分为:运输系统、图像采集系统和图像处理系统三部分。
运输系统 主体是一个三轴机器人,用于将昆虫从培养皿转移到微孔板,并安置摄像机拍摄单个样本的详细视图。机器人x轴和y轴的水平运输由LEZ1线性驱动器(Isel AG, Eichenzell, Germany)驱动;这两个线性驱动器均由高精度步进电机驱动,具有良好的定位精度。z轴由带步进电机的AR42H50主轴驱动器(Nanotec Electronic GmbH & Co. KG, Feldkirchen, Germany)驱动,实现上下运输。同时三个轴都由一个TMCM-3110电机控制器(Trinamic, Hamburg, Germany)控制,最终实现精确、快速、平滑的轴上运动。
运输系统由 Raspberry Pi (Raspberry Pi single-board computer)控制;该程序由Python软件编程,是专门为分拣机器人开发的。为了从培养皿中分拣昆虫并把它们放入96孔微板中,运输系统一个带吸液管尖端的吸力软管;软管连接到LA100注射泵,也由Raspberry Pi控制。
图2:机器人分类和排序流程图。(来源:论文)
图像采集 主要依靠运输系统安装的两个具有不同镜头的摄像机:概览摄像机和详视摄像机。
概览摄像机是XimeaMQ042CG-CM相机,带有CK12M1628S211镜头(Lensation GmbH, Karlsruhe, Germany),焦距为16毫米,孔径为2.8,位于放置昆虫的培养皿的正上方,负责拍摄所有昆虫的概述图像(如图3所示)。
图3:概览摄像机拍摄图像及分析图像。(来源:论文)
详视摄像机是一部XimeaMQ013CG-E2相机,配备远程中心TCST-10-40镜头,可放大1倍。该摄影机由机器人控制,可沿x和y轴移动到昆虫位置上方,对昆虫拍摄详细的图像,以便测量昆虫的各种细节(如图4所示)。
图4:详视摄像机拍摄图像及分析图像。(来源:论文)
图像处理 使用了三种不同的软件算法:第一个算法确定每个物体在培养皿中的位置;第二种是测量每只昆虫各部分的长度和体积;第三种算法基于人工神经网络将昆虫分为不同的种类。
确定昆虫位置 培养皿内主要是昆虫,也可能有昆虫碎片或其他物体。在拍摄概述图像之后,执行各种图像处理操作来检测对象:首先,用中值滤波器去除图像中的噪声;然后,将RGB图像转化为灰度图像;接着,用自适应阈值滤波器分离对象;最后,用轮廓查找器识别所有对象的边界,并对其进行颜色编码。(如图3所示)
昆虫的识别分类 为了识别不同种类的昆虫和未知样本,机器人应用了基于CNN的机器学习算法。主要对详视摄像机拍摄的图像进行分析处理,测量昆虫各部分的长度与体积(如图4所示),处理分析昆虫热像(如图5所示)。同时利用这类图像进行机器学习,不断完善机器人的分类处理能力。
图5:四种不同昆虫类的热图。(来源:论文)
分类准确度可达91.4% 目前该团队的分拣机器人可以分拣3毫米长的移液虫昆虫,体型较大的昆虫不适合通过吸虫分拣。该算法可以将检测到的昆虫分为14种不同种类。机器人对于膜翅目夜蛾科和半翅目叶蝉科的昆虫分类效果最好,所有分类均正确(100%);而双翅目夜蛾科昆虫分类正确率较低(75%)。该现象可能与算法所学习数据库的内容偏好有关。
该团队将继续更新生物分类识别技术,其愿景是通过人工智能代替人类完成对各类未知生物的分类编码工作。
论文链接:https://www.biorxiv.org/content/10.1101/2021.05.17.444523v2
参考内容:https://www.sciencemag.org/news/2021/06/artificial-intelligence-could-help-biologists-classify-world-s-tiny-creatures
招聘启事南方周末国际国防新闻部实习生招聘南方周末国际国防新闻部实习生招聘来源南方周末报社微信平台编辑周悦南方周末国际国防新闻部聚焦国际局势地缘政治军事发展等安全与防务核心议题,现因工作需要招聘若干名实习生。岗位1文字实习
美国研究朱锋对华战略竞争已适得其反朱锋对华战略竞争已适得其反作者朱锋,南京大学国际关系学院执行院长教授来源环球时报,20210924微信平台编辑周悦拜登政府上台以来,美国外交政策问题频出。曾担任过美国参议院外交事务
美国研究刘露馨大国竞争精英联盟与制度变迁美国外国投资委员会的制度演进逻辑刘露馨大国竞争精英联盟与制度变迁美国外国投资委员会的制度演进逻辑作者刘露馨,中国人民大学国际关系学院师资博士后来源当代亚太2021年第3期人民大学国政评论微信平台编辑周悦内容提要2
美印研究美国有没有把印度当成自己人?美国有没有把印度当成自己人?作者深海獭来源深海区微信平台编辑周悦在美国转向亚洲的战略中,印度虽然重要,却难以交心。当地时间24日,印度总理莫迪与美国总统拜登在白宫举行双边会晤。交谈
美国研究首次线下首脑峰会,美日印澳的野心有点大首次线下首脑峰会,美日印澳的野心有点大作者深海三文鱼来源深海区微信平台编辑周悦这可能会吓跑其他地区国家。对中国的复杂情绪,让他们坐到了一起。当地时间24日,美日印澳四国领导人要在华
法国研究庞中鹏马克龙为何站在东京奥运会开幕式贵宾席上庞中鹏马克龙为何站在东京奥运会开幕式贵宾席上作者庞中鹏,中国社科院日本研究所副研究员来源世界知识2021年第18期世界知识微信平台编辑周悦在东京奥运会上,法国总统马克龙成为惟一一位
金陵十二钗之林黛玉心较比干多一窍,病如西子胜三分林黛玉,金陵十二钗之首,西方灵河岸绛珠仙草转世真身。她生得倾城倾国容貌,兼有旷世诗才,是世界文学作品中最富灵气的经典女性形象。林黛玉与贾宝玉青春年少,由共同的理想志趣和叛逆精神而慢
钱穆读论语的最高境界钱穆(1895年7月30日1990年8月30日),中国现代历史学家。江苏省无锡人。字宾四。笔名公沙梁隐与忘孤云。斋号素书堂素书楼。历任燕京北京清华四川齐鲁西南联大等大学教授,也曾任
可园重现,原主陈作霖为著名史志学家史志馆内的可园如果您是南京的文史爱好者,一定知道陈作霖的大名,金陵通纪金陵通传金陵琐志五种这些流传至今的南京方志都出自这位晚清著名史志学家之手。如果您不钟情于历史,穿梭于南京时,也
你能忍受被贬谪的痛苦吗?对于贬谪这个词,想必大家都不陌生,毕竟高中语文课本上的各大诗人都被迫接受过贬谪,譬如王昌龄李白柳宗元刘禹锡小编在背书的时候也暗暗吐槽过当时的皇帝为什么要贬谪他们,导致后代的学生又要
红楼梦之尤三姐尤三姐,尤氏继母带来的女儿,尤二姐的妹妹,亦称作尤小妹。尤三姐模样儿风流标致,自有一种万人不及的风情体态。贾珍贾琏贾蓉等好色之徒,对她颇为馋涎。但尤三姐不愿像姐姐那样遭人玩弄,她用