“你说的那个,只是推送人工智能的上半场。”
顾莫杰又喝了口薄荷茶,对于陆文君没完没了的质疑已经有些疲劳了。
一个女人,在这个瞬息万变的时代,脱离前沿技术将近两年,怎么可能一夜之间,就靠枕边风补回来嘛。
喝完茶,他反问陆文君:“从我们刚提出‘给的再多、不如懂我’或者‘猜你喜欢’这些概念的时候,我们最初是怎么做的。还记得么?”
许是因为精神旺盛,陆文君回答得很快:“当然记得,不就是和我刚才说的那样么:优先训练机器人回答那些有标准答案的客观题,比如百度知道上已经有经过审核的正确答案的题目。
然后再轮到那些百度知道上还没有答案、但是有人问、咱用专门雇佣的回答问题团队找资料、回答、审核、上传——我记得你那年两-会的时候,为了推动中国铁塔的成立,为了给移动和电信被淘汰下岗的人找工作,不就弄了个人工智能中心,吸纳了十几万人专门答题、训练客服型人工智能么。”
顾莫杰总算有些欣慰,妻子的水平还没因为育儿而彻底还给老师。至少她怀孕之前已经知道的事情,至今都还记得。
“对,就是这样。那种人工智能,只能优先回答客观题,也就是有标准答案的题目。很适合当客服,当热线接线员,因为客服要回答的问题都是逻辑性很强的,很容易排查标准答案——
你不说我还忘了,从移动电信挤出来那十几万人,咱三、国家七,养着他们训练了两年,如今公司的客服型人工智能成长非常快,现在已经可以拿给各地的运营商、银行、机关衙门、法院进行测试了,估计年底就能通过验收。
明年开始,这些机关和事业单位就不用再在公务员招聘考试的时候招客服和接线员了。这两类人的工作,会永远在公职系统内被消灭。目前已经混进公务员和事业编的客服,已经够他们将来作为机器人客服的补充,用到死了。
再过一年,这个进度可以蔓延到相当一部分的企业单位客服人员。”
顾莫杰把这些信息和妻子说了一下,才发现自己扯远了,赶紧回到刚才的话题上。
“前面说了,让机器人‘听得懂’一切用人类语言提的问题、并且准确回答其中那些有标准答案的客观题,这就是深度学习算法对问题回答型人工智能的训练的上半场。
然后,从去年下半年,搞定nhn之后,咱的问题回答型人工智能已经发展到下半场了,严磊和他的研究院,如今天天就忙那些。只不过你在休产假,没了解罢了。”
“具体给我说说嘛,人家真不想脱节前沿太久,被人以为没见识。”陆文君的技术宅妹属性,也算是天生的了,并不是为了赚钱才对数理内容好奇的。作为顾莫杰的妻子,她绝不希望自己在生意上辅佐丈夫的价值就此终结。
“这个下半场,就是:当客观题部分,采用公用的大数据池训练完毕后,主观题部分,我们要依靠对每个用户细致入微的行为分析,来做到私人订制的‘初秘’。
也就是说,数年之后,每个‘初心’手机上的‘初秘’机器人,在回答各自主人提出的主观题时,答案是不一样的。这里面再也不依靠‘大样本容量的统计’来实现偏好筛选,而是完全按照每个人的喜好量身定做。”
陆文君歪着脑袋想了想:“每个人都根据自己本身的行为数据来揣测,那岂不是一开始很不准?那些不愿意配合、不愿意把行为习惯隐私泄漏给初音的用户,我们岂不是很难有进展?何况单个个体产生的数据频次太低了,很难通过聊聊几条信息分析出一个人的喜好啊。”
顾莫杰摆摆手,示意陆文君不必担心。
“你不懂里面的技术原理,就别瞎担心。这是一个循序渐进的过程。比如,我举个例子,就拿看书而言,曾经我们是把用户分成几个大类,有的用户爱看玄幻,有人爱看都市,有人爱看历史。然后他看哪类比较多,就把这一类最火的书推给他——这是最原始的弱智状态,都称不上人工智能。
第二步,当他有限地看了几本书之后,大致可以摸清这个人的脾胃。然后根据和他行为模式类似的人,按照‘人以群分’的算法,推而广之认为他和哪类人是一样的,把那一类人都比较爱看的东西推送给他。
如果他接受了,那么就留下一个喜好的数据烙印,如果他拒绝了,就进一步细分人群。这样一步步推进,最后用户会从数百万人一群的大群、细化为数万人的小群、最后甚至是数百人的小群。
这些人的经历、喜好、脾性其实是高... -->>
本章未完,点击下一页继续阅读