也是了,孟繁岐恍然明悟。
检测任务的数据集收集和标注的成本更高,这也是为什么孟繁岐夺冠的大赛,分类图片一千多万张,检测图片才几万张。
目前所有的这些内容全部都是人工去标注。
一张分类图片,只需要标注一个标签,它是什么即可。
而标注一张检测图片,经常需要在上面添加数个,甚至十数个检测框,需要细致到具体轮廓,然后再添加类别。
标注的成本,自然是十数倍的差别。
为图片添加选框和标签的工具也不完善,操作繁琐,就更使得其缓慢。
截止到现在,深度神经网络为基础的检测算法还有展现出什么实际的商业价值,还停留在实验室研究阶段,实际上并没有得到这些大公司足够的重视。
目前商业用的检测算法,还是传统技术为主,并不需要训练数据,而是通过人工设计的滤波器去提取特征。
孟繁岐演示使用的公开VOC检测数据一共就几万张,相比日后动辄几千亿的模型参数量,几个T的数据量,这个规模有点像过家家。
此时此刻,就白度内部而言,李彦弘这个深度学习研究院,也只在私下积累了不到十倍的私有数据量,也就差不多二三十万张。
对于白度来说,基于这个本钱,想直接像后来的ChatGPT一样,提供一个人人可用的AI智能,那还差了十万八千里。
“李彦弘开这个技术发布会的意图,其实就是伸手要数据。”孟繁岐稍一思索就想明白了,“通过展现这种神奇的效果,诱惑需要工业检测的厂商,需要医疗图像检测的机构,想要开发自动驾驶的车企。”
“你们给我数据,我就能帮你们做这个功能。”
李彦弘这是想趁这个技术优势,收割一大波免费的数据啊!
这小算盘,打得太精了。孟繁岐心中啧道。
这个时间段,这种图片数据的价值还没有得到广泛的理解,借助检测技术的飞跃,白度收割这些图片起来就像噶韭菜。
再过一段时间,就没那么容易白赚了。
“李总,你要是开技术发布会的话,能不能也宣传宣传我这个原作者,给我也打打广告?”孟繁岐半开玩笑半认真地说道。
李彦弘开技术发布会去介绍自己的YOLO检测算法的话,可想而知,其关注度还是非常之高的。
都说流量时代,就是一坨屎有了流量都能演男女主角。
李彦弘如果在发布会上,将自己的功劳如实说出,都不需要添油加醋。
其社会影响力,远远比自己发好几篇顶会都来得猛。
君不见,AI技术发了多少《自然》,《科学》顶刊了。关注度完全不如阿尔法狗击败李世石,柯洁。
老百姓不关注那个。
“当然没问题。”李彦弘非常爽快地答应了,“这个技术本身就是你独立研发创作,你愿意匿名,还是愿意来到台前,我都欢迎支持。”
“不过,如果要介绍你的话,我个人有一个小小的请求,我希望能够称呼你为,‘白度AI研究院特约研究员’,你看可不可以?”
果不其然,想要李彦弘为自己宣传,在这种事情上,他还是有自己的想法的。“虽然你拒绝了我的招募,没有在白度入职,但是我们的合作关系还是非常密切。有关这个技术,也牵涉到了千万级,甚至亿级的利益分配。”
“在技术发布会上,宣传你的身份为我们研究院的特别研究院,这对这项技术的成长是很有帮助的。”李彦弘娓娓道来,把孟繁岐说得一愣一愣的。
“客户知晓技术的创作者是我们的研究员,显得非常有保障,就会对白度更有信心,合作的意愿更强,更稳。”
李彦弘说得好听,但孟繁岐知道,他也是想借助自己目前在学界的名声和势头。
如今AI学界基本上已经普遍有共识,2013年最杰出的AI技术突破,就是孟繁岐的残差网络和生成式对抗网络。
在这个节点上,白度宣传自己为白度特约研究员,并且联合发布了第三个同级别的AI技术突破。
大家很难不把前面两个杰出工作也和白度联想到一起。
毕竟就在短短几个月的时间内,同时产出了这三个工作。
要么怎么说是华国首富呢,这脑筋和小心思,就是灵活。
“好的,没有问题。”自接触以来,李彦弘对自己还算真诚坦荡,虽能猜到他动过些别的心思。但在合约内容上,李彦弘一点也没吝啬,基本上都按之前谈得最大比例来订的分成。
-->>
本章未完,点击下一页继续阅读