The Innovation | 花伴侣专业版(FlowerMate 2.0): 利用人工智能鉴定中国植物
2024/05/18         点击次数:16506    阅读原文

让植物分类学研究成果走出实验室,成为所有人都能看得到、听得懂、用得上的财富。



导 读                    


           

物种的精准鉴定是人类认识和利用植物资源的前提,也是植物科学的基石。此前的植物鉴定完全依赖分类学家人工开展。近期,我们基于收集的上千万幅原创图片,建立了2万种植物的智能识别模型,可鉴定中国96%的常见植物,准确率高达91%,标志着植物物种的智能鉴定进入了新阶段,为开展多样性调查和植物鉴定提供了可靠的工具。

植物物种的精准鉴定是植物学、生态学、农学、林学、草药学,以及植物多样性调查、自然资源管理、生态保护修复等学科和领域的基础。如今,全球气候变暖及其导致的极端天气频发,已经严重影响了植物的生存环境,威胁植物多样性安全。许多新物种在被发现的那一刻起可能就濒临灭绝,甚至在被发现之前已悄然消亡。因此,我们必须尽快获得植物物种类别、分布和生存状况等的高质量数据信息。

然而,当前植物野外调查和鉴定完全依赖分类专家人工开展,费时费力,无法满足多学科和领域中迅速增长的需求,也制约了植物多样性保护领域的发展。开发便捷、高效、精准的植物鉴定新方法迫在眉睫。

2008年,中国科学院植物研究所李敏团队依托植物标本馆建立了中国植物图像库(PPBC,http://ppbc.cn)。经过十五年的运行和7万余名植物学专家和爱好者的共同努力,PPBC已收集各类植物图片1600余万幅,完成鉴定1190余万幅。

以PPBC为基础,团队于2013年与百度深度学习实验室合作,率先实现了1000余种花的智能识别;2016年与鲁朗软件合作,设计开发了可识别5000种常见植物的“花伴侣”App,至今在全球的下载量超过1300万次、识别量超过2.4亿次,已成为公众识别身边花草的常用工具。

最近,团队建立了可识别2万种植物的智能识别模型(以下简称20K模型)。通过整合最新的植物分类学研究成果,团队整理并筛选出PPBC上图片数量最多的339科3629属20105种植物。每种随机提取最多200幅图,共提取280万余幅图片,其中90%用于模型训练,10%用于模型评测。

经评测,20K模型物种水平的Top1识别准确率为79.3%,Top5识别准确率达到91.0%,属级和科级的Top5识别准确率分别高达 94.4%和96.2%(图1A)。并且该模型对从热带到寒温带、从盆地到高原、从森林到荒漠的乔木、灌木、草本等各类中国植物都有较高的识别准确率。模型在识别不同生活型的植物时,属级Top5识别准确率为92.7%至95.6%;识别不同温度带的植物时,属级Top5识别准确率为94%至95.7%(图1B)。

           

图1 精准的智能识别服务于植物多样性大数据建设

 (A) 20K模型识别测试集图片时在种、属和科级的准确率;(B) 20K模型在识别测试集中不同温度带(上部)和生活型(下部)植物时的准确率;(C) 按图片数量排序后PPBC 中每 1,000种(环形图)和每 5,000种(饼图)植物拥有图片的百分比。


               

同时,20K模型可识别的物种在PPBC上共有约1150万张图片,占已鉴定图片的96.4%(图1C)。PPBC上的植物图片是由7.2万用户在15年间陆续上传,可以从某种程度上反映专家和公众在中国观察到的植物情况。如果把PPBC的图片数据集看作一次由7.2万人开展长达15年的植物联合调查,则20K模型可准确识别中国可观察到的96.4%植物,标志着中国常见植物的智能识别已基本完成。


               

我们开发的“植物智”App(FlowerMate 2.0,花伴侣专业版)已接入20K模型,并整合了植物名称、形态、分布等数据,可实现植物的在线识别和物种检索。“植物智”使每个感兴趣的用户都能成为合格的自然观察者,每部智能手机都能变成移动的植物观测站,每次识图都可视为一条宝贵的植物观察记录,为专家和公众合作开展植物多样性调查、保护、管理以及大数据建设等提供了高效、可靠的辅助工具,并必将极大促进中国乃至全球范围内长期、动态、智能的植物多样性研究和数据发展(图1)。


   

总结与展望                        


                       


               

作为探索自然的辅助工具,智能识别应用让植物分类学研究成果从实验室走向了社会公众和各行各业。花伴侣App已被广泛应用,满足人民群众对自然的好奇与热爱、服务于公民科学素质提升等社会领域。花伴侣专业版“植物智”App进一步实现的植物精准智能鉴定,必将推动研究范式和工作方式创新,服务于农学、林学、生态学、生物学、医学等科学领域和农业农村、自然资源、生态环境等行业部门。                

          
   

责任编辑


           

鲁显楷   中国科学院华南植物园

郑棉海   中国科学院华南植物园

   

                    

扫二维码|查看原文                    


                   

原文链接:https://www.cell.com/the-innovation/fulltext/S2666-6758(24)00074-2

本文内容来自Cell Press合作期刊The Innovation第五卷第四期以Letter发表的“FlowerMate 2.0: Identifying plants in China with artificial intelligence” (投稿: 2024-01-21;接收: 2024-05-05;在线刊出: 2024-05-06)。 

DOI: https://doi.org/10.1016/j.xinn.2024.100636   

引用格式:Xie G., Xuan J., Liu B., et al. (2024). FlowerMate 2.0: Identifying plants in China with artificial intelligence. The Innovation 5(4), 100636.

   

作者简介                

           

李 敏,高级工程师,中国科学院植物研究所大数据与AI生物多样性保护研究中心副主任,致力于物种大数据与人工智能识别应用研发。主持建设了中国植物图像库、iPlant 植物智——中国植物物种信息系统;研发了“花伴侣”“花伴侣专业版”等植物智能识别应用产品,软件著作权登记多项,主编了《植物星球》《植物科学数据规范》等图书30余部,论文发表在The Innovation, Science Bulletin,Earth System Science Data 等刊物。2015年被《中国科学报》评为十大科普人物,2018年入选“中国科学院关键技术人才”,2023年获聘中国科学院特聘研究岗位骨干。                       

                   

个人主页:http://www.iplant.cn/p/limin

2024/5/27 9:02:46
iPlant.cn 植物智——中国植物物种信息系统 © 2009-2025 版权所有 中国科学院植物研究所   京ICP备16067583号-9