9月4日,2020年中国国际服务贸易交易会在北京国家会议中心如期举办,据统计,有148个国家和地区的33家国际组织、74家驻华使馆、110家境外商协会及机构、17158家企业机构、96635人参展参会,世界500强企业中,也有399家企业的总部或分公司参展参会。作为疫情之后的首场线下重大国际经贸活动,业界大咖们汇聚于此,共同关注疫后产业突围的思考。
在这场大会上,值得关注的自然是科技领域。会上,黑科技林立,人工智能影像互动技术、人工智能和物联网应用、AI巡控机器人等等悉数亮相,指向了一个共同的亮点——人工智能,而作为人工智能的三要素之一的重要产业——AI数据服务。在这场盛会上,云测数据代表行业首次对外发布最新AI数据服务成果——云测数据项目最高交付精准度达到了99.99%,远超平均95%精准度的业内水平。云测数据凭借多年来企业服务积累的丰富经验,先进的数据采集管理水平和自建数据采集中心的优势,将持续为AI行业提供稳固的发展基石。
众所周知,在AI领域,“成也数据,败也数据”,而在大数据时代,随着AI产品的逐渐落地,除去“大”和“多”两个关键词,“精准”成为了更重要的衡量维度,对于AI产品来说,AI数据的精准度失之毫厘则差之千里,而在AI产品落地的过程中,AI数据精准度的差异会愈发的明显。
以贴近日常生活的AI技术为例——在购物软件上,很多消费者会习惯于使用“拍图识物”的功能,缩短挑选商品的路径。更加精准的AI数据,则可以让软件更加迅速准确地识别图片上的关键图像,协助消费者迅速的筛选心仪的商品,避免“大海捞针”式的低效搜索。所以,无论是在助力AI产品的实际落地和应用上,还是在日常生活的点滴之中,高精准度的AI数据都承担着相当重要的作用。
云测数据提供的,就是这样高质量、高精准度的AI数据,为人工智能企业提供坚实的数据核心壁垒。
根据2018年智研发布的《2019-2025年中国数据标注与审核行业市场专项分析研究及投资前景预测报告》显示,近几年,数据标注与审核行业快速发展,2018年市场规模已达到52.55亿元,而在这样的增量市场中,大批看到了企业需求的AI数据从业者疯狂涌入,使得整个行业出现良莠不齐的情况,这对追求用户体验的人工智能产品而言是致命的,“如果数据不够纯净,就像人吃了坏掉的食物,只会产生病状,不能起到吸收利用的作用。用到机器学习中,就会破坏AI的数据学习体系,产生大的误差,而误差产生后,后续的自主学习又会产生偏离,形成恶性循环。”云测数据总经理贾宇航这样说道。
为了解决这样的问题,云测数据做出的改变,是引领数据标注行业,从“劳动密集型产业”转化为“技能密集型产业”。云测数据做出的积极改变,首先从AI数据的源头开始,提升AI数据获取的纯净度——行业首创数据场景实验室,为各种细分场景模拟无噪的落地场景数据。
为了进一步提高标注过程中的精准度,云测数据团队还研发出了自有的标注平台,从图像、文本和音频三个维度进行数据的精准标注。而在针对一些特殊的标注时,例如自动驾驶中的3D点云标注,这套自研标注工具中先进的渲染引擎,能提升整个过程的流畅和快捷,保证准确性,同时通过降低人为因素可能导致的误差,确保了降本提效。
在标注人员的管理上,云测数据也配备了完善的流转机制、培训机制、晋升机制等。为了确保在专业要求较高的领域标注人员能够做出正确的标注判断,云测数据还配备专门的培训师,对每个行业细分领域的专业知识进行培训。
以大家生活中很熟悉的AI电话客服为例,当AI客服询问用户是否购买某款商品时,各种用户会给出不同回答:“我要和家人商量一下”;“我会考虑”;“我现在不方便,你一会儿再打过来”等等,背后的含义各式各样,可能是暂不购买,暂不考虑,拒绝购买或者兴趣较大。那么,数据标注就需要对这些对话背后的意图进行标注和分类。而经过培训,数据标注员可以迅速而精准地对句子进行泛化,以不同的描述方式重组或扩充句式、标签等,大大提升了AI对话的准确度和客户的满意程度,而只有这样的服务,才能使得AI客服的落地具有实用意义,放诸其他AI领域,道理也是相同的。
在以上各个方面的共同作用下,云测数据才得以呈现出如今最高精确率高达99.99%的高质量AI数据。
没有AI数据,人工智能就没有未来,是过去业内广为流传的真理,而现在,随着AI技术的不断发展,在技术平台搭建日益完善的如今,“没有高质量的AI数据,人工智能没有未来”,将成为更多AI从业者的共识。毕竟,AI技术发展的瓶颈已经在逐渐打破,落地实用将成为行业的下一个挑战。高精准度、高质量的AI数据,将助力AI 产品具备更强大的服务能力,走进千家万户的现实生活。
而作为服务了众多头部互联网企业、科技企业和智能化转型的传统企业的云测数据,始终走在提升平台技术实力、数据精准效率、数据隐私安全的路上,通过于提供更高质量的AI数据服务,为AI 产业的发展持续赋能。