admin 发表于 2019-9-27 13:03:46

给人工智能当老师:拉框、拍摄、识万物

  芒种刚过,河南郏县东郊,望不到边的农田里,农民们弯腰割起了小麦。不远处机械厂、汽车修理厂,机器声此起彼伏。但再往西的建材广场却人来人往,这些天,广场三楼,来了500个长了眼袋的人。
  这500个人中,有刚从玉米地里匆匆赶过来的农民,连草帽也没来得及摘下。有机关大楼下了班的公务员,也有服装店里请了假的导购员。年轻小姑娘们聚在一起,谈论着护肤和美妆。角落里,大腹便便的中年大叔点了根烟,低头玩起手机。
  他们被轮流带进了临时搭的摄影棚里——一个光线昏暗、不到30平米的小房间,墙壁不久前刚被刷得雪白,里面摆着椅子、三脚架和灯光器材。
  有人指引他们坐在椅子上,面朝一部被固定在黑色三脚架上的手机,手机和眼袋者之间的距离是25厘米,不能多,也不能少。每次开拍前,一名皮肤黝黑,身材微胖,长着老实憨厚方脸的员工都会掏出卷尺,仔细再量一遍。
  在白光、黄光、暗光等不同光线下,张凯拍了四轮,加起来总共100张。一般情况下,他3分钟就能拍完,不会超过5分钟。
  这项工作名为“数据采集”,眼袋者能得到一个价值一二十元的塑料大桶作为奖品。采集而来的照片、语音等数据,将会提供给人工智能企业,用于机器的训练和学习。
  刚接下任务时,领导告诉张凯,这次被拍下的500双眼袋,会用来给一款手机软件做测试,以便优化软件的美颜功能。但具体怎么测试、怎么优化,领导没说,张凯也没问。
  去年夏天,张凯有了孩子,他辞掉了原本在石子厂维护器械的工作,回家照顾妻儿。一两个月后,张凯得重新工作养家,一家名为“千机数据”的公司正好在招人,“轻松、离家近、工资高”。
  公司在县城东边一个建材广场的三层,从张凯的老家长桥镇开车过来,只用20分钟。他推开公司门的那一刻,空调的凉风灌进身体,面前的场景让他有些震惊:几百名员工坐在棕色的沙发上,埋在电脑屏幕前,不停地拖动鼠标,敲击键盘,“像个大网吧”。
  人力主管向他介绍说,公司主要做数据标注,简单来说就是给图片上的物体拉框框,只要会用电脑就能干。工资保底2000块,多劳多得。
  张凯从没听说过“数据标注”,也不懂为什么拉框。但公司环境好,不像以前一样风吹日晒,当即决定留下来。
  他被安排在一个有电脑的工位上。领导传来几百张厨房、餐厅的图片。张凯需要做的是:把图片上的碗、碟、杯子、筷子等餐具都框出来,然后选好属性、分好类。拉对一个框能赚4分钱。
  第一天上班,张凯费劲拉了几百个框。他不熟悉规则,比如,三个堆在一起的碗,是应该一起拉一个框,还是分开拉三个框?
  一周后,他已经熟练到每天能拉几千个框,挣100多块钱。时间久了,张凯看什么都带框,看到家里厨房的锅碗瓢盆,他第一反应是,框框应该从哪个角度拉?拉多大比较合适?
  才来三个月,张凯就开始挑战难度更高的3D全景图。图片都是立体的,有多个平面,分布着各种车辆,有卡车、小汽车、大巴车等,张凯要把车辆都框出来,再分门别类。
  这项工作要有良好的空间感才能完成。玩“穿越火线”(一款射击类游戏)的经验帮上了张凯,那款游戏的场景也是立体的,常常需要切换视角来观察敌人。张凯没费多少力气就上手了。
页: [1]
查看完整版本: 给人工智能当老师:拉框、拍摄、识万物