替代资产增长支持蓝天利润激增130% FiREapps任命产品管理总经理 ICE Endex完成GasTera储气罐拍卖 华尔街视界和MT Newswires帮助量化发现Alpha Linedata收购Gravitas Valphi推出由DataArt构建的财务分析工具 SkyBridge Capital出售Anthony Scaramucci的多数股权以立即辞职 Lyxor表示,对冲基金在政治和地缘政治压力下具有弹性 RWC全球视野基金预计三年内将获得19%的回报 欧洲重组预计将在2017年达到下一个高峰 DTCC任命总顾问 Energie Steiermark选择Ancoa进行能源贸易监控 使用SPC作为新兴管理器平台 EBS Live Ultra以5ms的间隔提供数据 对冲基金行业的资产管理规模在2016年超过32亿美元 光速机构推出主要经纪部门 Bricknode在云中启动完整的经纪系统 使用SPC作为新兴管理器平台 FiREapps任命产品管理总经理 EBS Live Ultra以5ms的间隔提供数据 Linedata收购Gravitas DTCC任命总顾问 欧洲重组预计将在2017年达到下一个高峰 Energie Steiermark选择Ancoa进行能源贸易监控 LME首席执行官退休 FundRock收购基金合作伙伴 国际投资者将通过Euroclear进入智利 Torstone与Unavista合作提供MiFIR报告解决方案 Silverfinch使用PRIIP模板加强数据模型 RJ O'Brien任命伦敦分公司总经理 FundRock收购基金合作伙伴 CRS下的税收报告将于2017年开始 一月份投资者信心下降0.3点 Lyxor表示,制药并购将提高事件驱动型对冲基金的收益 哈特拉斯基金会庆祝纪律部队基金成立三周年 巴克莱对冲基金指数在12月上涨1.22% PEGAS推出时差产品 金融服务业在2016年发现高水平的欺诈和风险事件 Castle Hall Alternatives扩展到阿布扎比 MSCI任命证券化产品研究负责人 税务从业人员詹姆斯·R·布朗(James R Brown)重新加入绳索与amp灰色 阿尔格收购Weatherbie Capital 税务从业人员詹姆斯·R·布朗(James R Brown)重新加入绳索与amp灰色 Silverfinch使用PRIIP模板加强数据模型 对冲基金在2016年经过风险调整后胜过股票和债券 EISWallet在退税截止日期之前启动 CFTC任命市场监督部总监 TABB说,衡量对于真正了解流动性成本至关重要 CBOE推出标准普尔500范围保费收入基金 Ramius首席执行官辞职寻求新的职业机会
您的位置:首页 >行情 >

人工智能训练师究竟做些啥 挣得多不多?

2020-08-16 21:40:31 来源:经济日报

谁能训练人工智能   本报记者 佘 颖

最近,人社部公布了一批新职业,其中有个新职业叫作“人工智能训练师”。听起来高大上的人工智能还要人来训练?谁能训练这些看不见、摸不着的人工智能?“人工智能训练师”究竟做些啥?关键是,挣得多不多?

带着这些问题,经济日报记者近日走访了百度(山西)人工智能基础数据产业基地。这里是目前国内从业人员与产值规模第一的单体数据标注基地,入驻企业35家,AI数据标注师从业人员超过2300人。

“我是数据标注员,中专学历,每天工作8小时,大概能挣300多元。”面对记者的问题,山西麟诺网络科技有限公司的李宇龙自豪地给出了答案。这个收入对在太原生活的年轻人来说算高水平了——数据显示,2019年,太原市城镇居民人均可支配收入36362元。不过,李宇龙说自己不算最高的,“我有的同事一天能挣1000多元”。

李宇龙学历不高,原本与人工智能没什么关系。2018年,山西麟诺网络科技有限公司成立,李宇龙经朋友介绍来到这家公司。

“当时我也不知道数据标注员是做啥的,更没听说过人工智能。老板就交给我一套规则,让我按照规则在电脑上认车道线。”那时20岁出头的李宇龙正是肯学的时候,短时间内就熟悉了规则,还总结出标注车道的新规律。

作为这项新职业的老员工,李宇龙已转型培训师,除了日常工作,还承担起公司新员工的培训教学,“有的同事会转型做项目或者内容审核员,还是有上升空间的”。

“数据标注技术门槛低,招工人群范围广泛,对于促进就业作用显著。”山西麟诺网络科技有限公司负责人李应维告诉记者,目前公司招聘的员工以大专生为主;标注规则由百度与相关领域专家共同制定,并形成可操作软件平台提供给企业,对员工简单培训就能上手。以人脸为例,目前他们能实现对约150个特征点的标注。大致标注规则是数据标注师看到双眼皮就标记双眼皮,看到狮子鼻就标记狮子鼻,让机器自己理解与学习。标注特征点越多,AI就越能精确识别人脸。

看似简单的工作,背后是庞大数据基础做支持。算法、算力与数据是人工智能发展的三大要素,其中数据是人工智能发展的燃料。每天,人类社会产生的海量数据必须经过清洗与标注,换成人工智能熟悉的语言才有价值。因此,人工智能训练师主要任务就是数据采集和标注,特别是数据标注。如果说人工智能是个孩子,数据标注师就是带领这个孩子认识世界的启蒙老师。有了足够多、足够好的数据,AI才能学会像人一样去感知、思考和决策,更好地为人类服务。

人工智能产业发展之初,数据采集与标注需要人力完成的部分比较多,现在数据平台已有了持续学习能力,大部分采集与标注工作人工智能自己就可完成,实现预标注与自动标注。因此,目前数据标注工作以机器辅助与人工标注结合为主。除了眼底检查片、肺部X光片等技术含量较高有专业要求,大多数员工均能按照规则,在平台上完成语音、人脸、道路的标注操作,只要能熟练操作电脑即可。

郭梅是新职业的受益者。34岁的她原本在山西一家煤矿做监控员,为照顾到太原上学的孩子,她到学校附近的数据标注基地求职。经过公司岗前培训与团队帮助,她从起初每天标注两三百张图,提升到每天能完成1300多张。

数据标注员的工作随着人工智能发展需求不断调整。前几年人工智能发展伊始,语音识别、人脸、图像等识别需求大;近几年无人驾驶进入发展快车道,郭梅与李宇龙的主要工作就改成无人车、地图、3D点云等数据标注,天天看的是车道线、行人、障碍物。

“还有一些语音识别项目,比如我们接了一些方言语音数据标注项目,这就需要招聘当地人来完成了。”李应维说。

有了足够技术基础,数据标注员还能教会人工智能新任务。疫情期间,戴口罩的人脸识别需求激增。“根据客户需求,山西数据标注基地采集了大量戴口罩人脸照片,由数据标注师对眉毛、眼镜、颧骨等人脸关键点精准标注,训练人工智能完成了戴口罩人脸图像识别。”百度(山西)人工智能基础数据产业基地负责人尉赤说,“人们能在不摘口罩情况下实现精确体温测量,或是通过人脸闸机,背后就是这些数据标注员在训练人工智能。”

艾瑞咨询发布的《中国人工智能基础数据服务行业白皮书》预测,随着全球人工智能产业、物联网、5G的爆发式增长,到2025年,全球每年产生的数据量将从2016年的16.1ZB猛增至2025年的163ZB,其中80%至90%是非结构化数据,需要经过清洗与标注才能被唤醒价值。在我国,每年需要标注的语音数据超过200万小时,图片则有数亿张。因此,人工智能数据标注师的岗位需求将持续增长。尉赤透露,今年基地新招了500多人,未来5年计划培养5万名AI数据训练师,并引入更多AI合作伙伴。李应维也预计,到明年自家企业用工将翻一番,从160多人扩展到300人左右。未来,数据标注将成为创造大量就业需求的新兴职业领域。

佘 颖

佘 颖

免责声明:本网站所有信息仅供参考,不做交易和服务的根据,如自行使用本网资料发生偏差,本站概不负责,亦不负任何法律责任。如有侵权行为,请第一时间联系我们修改或删除,多谢。

今日中国财经