港城大团队用AI解决无人机送餐地址识别难题,并提出数据标注新方法
创始人
2024-05-28 20:40:54
0

‍当前,外卖业务在全球范围内、尤其在中国得到了迅猛发展。随着生活节奏的加快,外卖服务成为日常生活中不可或缺的一部分。

然而,传统的人工送外卖模式面临着种种挑战和限制,包括配送距离受限、复杂路面环境、景区等封闭场景的低效率问题,以及特殊情况下的配送障碍。

比如,在新冠疫情爆发时期,为了防疫许多地方采取了封锁措施。

鉴于此,香港城市大学助教教授宋林琦和合作者美团开始关注到无人机送餐系统。

图 | 宋林琦(来源:宋林琦)

该系统凭借快速、成本低廉、能适应各种环境和天气条件、甚至能适应疫情封锁等极端情况的特点,展现出了巨大的发展潜力。

无人机送餐不仅能有效分担传统外卖员在极端天气或环境下的工作负担,还能显著扩大用户的点餐范围,从而极大地提升服务效率和用户体验。

然而,在实际操作中,该团队遇到了一个关键的技术难题:由于用户在外卖下单系统中填写的地址往往风格各异,常常出现非结构化的描述方式。

尤其在中国,一个地址可能有多种不同的表述方式,这给基于规则的字符串地址解析方案带来了巨大挑战。

在这样的背景下,他们决定借助当前自然语言处理(NLP,Natural Language Processing)、大模型领域的快速发展,以及借助图形处理器(GPU,graphics processing unit)计算性能和推理速度的显著提升,采用人工智能和 NLP 技术来解决这一问题。

研究中,他们发现此前使用的人工标注数据是一种很好但是比较贵的方式,因此希望通过大模型来降低标注成本,同时保持数据标注的质量。

然而,尽管大模型本身能够完成这些任务,但在工业界的商用过程中会遇到法律、用户数据安全等方面的挑战,加之大模型的训练和推理成本高昂,速度上也不具备优势。

而该课题组发现:大模型在某些具体的细分领域和特定应用场景下能力依旧受限,性能比不上人工的数据标注。

因此,他们选择使用更小的语言模型来进行数据标注。这种方法不仅经济实惠、高效快速,还能保证标注风格的统一性。

这是因为:如果同一批语料由多人进行标注,由于每个标注者的习惯、任务理解可能不同,难以保证数据集的一致性。

因此,本次方法虽然在精度上可能与人工标注存在差距,但考虑到成本和效率的优势,以及标注风格的统一,其具有很大的应用潜力。

总的来说,本次研究不仅旨在解决无人机送餐系统中的地址难题,也致力于探索新的知识和方法,以促进无人机送餐服务的广泛应用和发展,从而为社会带来更加便捷、高效的外卖配送解决方案。

(来源:arXiv)

具体到研究细节上,课题组不仅要关注技术的可行性,还要考虑实际应用的需求和限制。

利用工业界合作公司提供的样本进行了初步尝试之后,他们确定了采用 NLP 领域的序列标注方法作为解决问题的主要技术路径。

这一决定是基于对问题本质的深入理解和技术可行性的综合考量。

在序列标注方法的基础上,他们进一步尝试和比较了不同的模型,重点考量了准确率和响应速度这两个关键指标,最终确定了最适合的模型方案。

根据机器学习中的“标度律(scaling law)”原则,该团队扩大了数据集的规模以提升模型的准确率。

期间,他们面临着数据标注成本高、迭代速度慢的挑战,最终通过使用一些大模型产品来标注数据,探索能否通过大模型来缓解这一问题。

宋林琦表示:“项目的成功离不开团队合作和与工业界合作伙伴的紧密合作,合作公司提供的实习机会让我们的研究人员更加贴近实际业务,促进了研究成果的落地实施。”

在项目后期,课题组针对所开发的系统进行了全面的测试和评估,根据测试结果不断优化模型,直至满足实际应用的需求。

通过上述阶段的紧密协作和不断迭代,本次研究不仅成功解决了无人机送餐系统中的地址识别问题,还在数据标注领域探索出了新的方法和途径。

事实上,一开始课题组沉浸在算法的精度提升上,毕竟从学术角度来看,精确性是衡量研究成功与否的关键指标之一。

然而,当他们将这些算法试图应用到实际的无人机送餐系统中时,他们面临了一个重大的挑战:算法的鲁棒性和实效性。

合作伙伴公司的工程师向他们指出,尽管他们的模型在标准测试集上表现出色,但在复杂多变的实际环境中,其性能大打折扣。

这个反馈让他们意识到,学术研究和实际应用之间存在一定的 Gap,迫使他们重新思考和调整他们的研究方向。

在尝试使用大型语言模型进行数据标注的过程中,他们面临的另一个挑战是如何处理和保护用户数据的隐私。

由于他们的数据来源于用户的历史下单记录,这涉及到大量的个人隐私信息。

在开始项目之前,他们必须对数据进行严格的审核和脱敏处理,这个过程比预期要复杂和耗时得多。

宋林琦说:“合作公司的团队在这方面给予了极大帮助和指导,也让我们深刻意识到处理真实世界数据时需要考虑的不仅仅是技术问题,还有伦理和法律问题。”

尽管他们在数据标注方面取得了一些进展,但合作伙伴公司很快指出,即使是大模型产品也不能直接应用于无人机送餐系统。

主要的限制因素包括处理速度和潜在的用户隐私问题。这让他们意识到,尽管大模型在学术研究中表现突出,但在工业应用中,还需要克服很多实际的障碍。

值得一提的是,通过这次项目,他们开始将目光从纯粹的学术研究、转向围绕工业界实际需求开展研究。

通过与合作公司的紧密合作,他们不仅获得了宝贵的实践经验,还发现了许多新的研究课题和方向。

日前,相关论文以《大模型可以替代人工标识吗?无人机送货精细中文地址实体识别数据集的个案研究》(Can LLM Substitute Human Labeling? A Case Study of Fine-grained Chinese Address Entity Recognition Dataset for UAV Delivery)为题发在 arXiv[1]。

Yuxuan Yao 是第一作者,香港城市大学助教教授宋林琦担任通讯作者(2024 年 7 月起将担任该校长聘副教授)。

图 | 相关论文(来源:arXiv)

本次研究中,他们主要关注大模型用于中文的数据标注。接下来,他们一方面准备训练自己的模型;另一方面也将评测现有大模型的其他方面的能力。

另据悉,宋林琦实验室主要从事人工智能理论和自然语言处理的研究,尤其关注大模型相关的微调、检索增强生成、解数学题等推理能力、具身智能等课题。

“我们与业界有着广泛合作,也有充足的算力,欢迎对大模型感兴趣的同学联系我们交流合作。”宋林琦最后表示。

参考资料:

1.https://arxiv.org/pdf/2403.06097

运营/排版:何晨龙

相关内容

热门资讯

为何判梁某滢死缓?一审判决书曝... 12月20日,成都27岁女子王紫雅家门口被杀案一审宣判,成都市中级人民法院判处被告人梁萌萌(化名)死...
一座超大城市的智慧治理之路 白鹭坡书吧。 深圳城景。 车车协同,无人环卫作业。 清晨,深圳南山区科技园路,一辆外形普通的环卫...
解码冰雪经济新动能|冰雪装备制... 火热的冰雪运动带动了对冰雪场地和冰雪装备的需求。 近年来,随着冰雪装备自主研发能力不断提升,在河北...
原创 《... 12月24日,电视剧《老舅》播出至第20集。在最新的两集内容当中,舅妈去世,老舅出国务工。而这些剧情...
孩子迷恋网络小说 家长应该如何... 微信公众号提问 孩子今年上初二,最近发现她迷上了网络小说,每天写完作业后会抱着手机看,尤其是周末不限...
莫言直播间对话徐志胜:如果我年... 12月23日晚,莫言在自己的直播间与脱口秀演员徐志胜对谈,向网友推荐《生死疲劳》精装纪念版。 莫言与...
“土味”乡村大集为何火爆出圈 近段时间以来,全国多地一些“土味十足”的乡村大集火爆起来,不仅吸引越来越多城里人去赶集,一些自媒体也...
冬季低温雨雪冰冻天气来袭,如何... 人民网北京12月24日电 (记者乔业琼)据山东疾控微信公众号消息,冬季低温雨雪冰冻天气频繁来袭,对大...
招商证券:岁末年初市场风格特征... 智通财经获悉,招商证券发布研报称,从历史经验看,岁末年初时段市场风格会呈现出明显的防御性特征,大盘价...
原创 “... 近日,海南省新闻办公室召开海南省“禁塑”五周年进展情况新闻发布会。五年来,海南省在“禁塑”工作中形成...