谢妍姗拉了拉他的袖口:“也从我的里面扣吧,我们一人一半。”
柯昱垂眼看她,语调自然地温和下来:“我哪舍得?说好了养你。”
谢妍姗小声说:“我哪用你养?你别太累了。”
柯昱将她搂进怀里:“有你在我就不累。”
梁萤打了个寒战,出了一身的鸡皮疙瘩,识相地撤退了。
【5】
接下来的日子,一切紧锣密鼓地进行着。
梁萤每天准时找店家送来咖啡和三餐,将大家的胃安排得明明白白。
有了梁萤的支援,组员们的工作效率也有所提升——难怪大企业的办公环境总是设计得无比舒适。
高负荷、高难度的项目十分锤炼人对未知问题迎难而上的能力,现在遇到层出不穷的错误信息,谢妍姗已经能做到处之泰然了。
不过,科研组碰上了新的问题。
看完阶段性报告,柯昱总结道:“虽然我们的模型已经在公开数据集上进行了测试,但现在测试的图片比较简单,真实情况下人脸的形状会因遮挡而改变,我们需要更复杂的数据。”
简而言之,用算法来鉴别戴口罩的人脸,就需要大量的戴口罩人脸数据,目前没有现成的数据库。
数据是模型的养料,训练的数据规模越大,识别准确率往往越高。
组员们讨论完,想到一种方法,将市面上各种类型的口罩、围巾等遮挡物与不同的人脸进行融合,生成海量遮挡脸部的训练照片。
同时,这些照片需要进行数据标注。
这是一项十分耗费人力的工程,虽然学校为人工智能实验室研发团队配备了数据标注小组,但人手毕竟有限,目前可使用的数据还不够支撑巨大的训练量。
柯昱将这样的情况向人工智能实验室反映,很快便收到了其他组的积极响应,大家愿意在做自己课题的同时,助他们一臂之力。
高学姐率先表态:“我们组正在研究用GANs(Generative Adversarial works,生成式对抗网络)做图像生成,可以帮你们的忙。”
科研小组A:“我们组帮忙用脚本抓取图片素材。”
科研小组B:“我们组来做图片合成。”
科研小组C:“给我一天,我们组写一个方便你们做数据标注的软件。”
科研小组D:“我们组的旗舰显卡借给你们训练模型。”
剩下技术不强的,就贡献体力,手工进行数据标注。
另一边,在梁萤的非凡号召力下,不少工程学院的学生下课后就自发来做数据标注,之后其他学院的学生也踊跃报名。“后援团队”越发浩荡,几度出现因太过拥挤,学校安排大家到工程学院教学楼的中央广场进行露天数据标注的盛况。