人工智能作为一项引领未来的战略性科技,已成为各领域数字化、智能化转型的基础与关键。伴随着技术进一步成熟,AI商业化落地热潮即将开幕。正值浪潮初始,AI数据安全事件却频频发生,由此引发了大众担忧。“如何在智能化进程中,保障数据安全?”成为人工智能发展伦理下的重要议题。
数据安全需从生产源头规范
数据作为驱动人工智能的三驾马车之一,其重要性不言而喻。现阶段,以深度学习为代表的人工智能算法模型搭建与迭代优化,都需要大量优质数据作为“燃料”。数据,已然成为一种软性资源。
机器学习领域权威学者吴恩达曾在公开演讲中多次表达过数据的重要性,“科技公司的壁垒不再是算法,而是数据。”
对于科技企业而言,数据意味着未来。如若发生数据泄露,无疑是自毁城墙。并且,大量AI数据涉及到人脸、指纹、虹膜图像、声纹、消费习惯、个人偏好等生物特征及隐私信息,一旦泄露,将造成极大的社会负面影响,不仅企业声誉、经济利益受损,甚至还需要面对诉讼等法律指控。
由于数据安全治理的紧迫性,国内科技企业都投入了巨大的精力,进行安全漏洞治理,但在AI数据生产的源头,却鲜少顾及。
在AI领域,单个项目的数据需求量非常大。训练一个最简单的图像识别算法,需要至少数万张有完整标签的标注图片;一个文本审核程序,则需要数十万甚至上百万条NLP数据训练;而布局一个智慧城市应用,所需的数据量更是惊人。这些庞杂的数据需要大量人力处理,因此,大部分科技公司选择将这部分业务委托外部处理。
目前,AI数据生产主要依赖于市场上林林总总的数据生产服务商、标注团队以及兼职个人,由于缺少安全生产规范,行业整体处于野蛮生长状态,“灰产数据”“层层转包”“数据转卖”……行业乱象屡见不鲜,而对于企业来说,本应是最核心的资源——数据,就在层层流动中,增加了泄露、滥用的潜在风险。
景联文科技:数据安全是标准,也是底线
AI数据相对门槛较低,几台电脑、几个人力就能组成一个标注团队,因此涌进了大批投机的“掘金者”,他们缺乏安全生产意识,也没有完善的数据安全处理规范,但却能通过众包模式,成为市场中的主力军。
据景联文科技CEO郑晓薇介绍:“目前AI数据行业缺乏一个硬性安全生产标准,大部分情况,数据安全取决服务商自身的管理能力以及道德标准。”
景联文科技作为国内领先的指纹防伪技术提供商,“安全”就是刻在骨子里的基因。在指纹防伪领域,景联文科技拥有多项自主知识产权专利及软件著作权,连续两届拿下LivDet:Fingerprint Liveness Detection Competition(国际活体指纹检测大赛)第一名。此外,公司也是IIFAA(互联网金融身份认证联盟)、全国信息技术标准化技术委员会生物特征识别分技术委员会成员单位,曾参与编撰行业标准规范性文件《生物特征识别白皮书(2019版)》。
因为长期与指纹这类敏感数据打交道,在景联文科技内部拥有着一套成熟的数据处理流程与存储方案,并且率先通过了国际ISO27001信息安全管理体系认证,以安全为前提,为企业客户提供高质服务。
2016年,景联文科技带着成熟的隐私数据处理方法,以及长期深耕To B市场的流程管理经验积累,全力投入AI数据采集标注产业。
在数据业务起步初期,景联文科技就将“安全”贯彻落实到数据生产的每一个流程中,从作业环境、网络环境、标注工具、数据存储、数据交付、定制服务六个维度出发,全链路保障数据安全。
作为业内数据安全的正面典范,景联文科技还在不断优化自身服务流程,并希望形成一个行业标准进而影响产业。
对于在安全生产上的投入,郑晓薇表示:“数据安全既是景联文科技的标准,也是底线,投入是必要且有价值的。”
目前,AI还是一门依托海量数据驱动知识学习的学科,AI算法模型从技术理论到应用实践的过程,依赖于大量的结构化数据,因此,数据安全将直接影响AI商业化落地进程。从行业发展的角度看,AI数据生产安全标准化、规范化是一条必行之路,而景联文科技愿意做这条道路的先行探索者。