文章目录[+]
前不久微博上流行过一阵挑逗色情内容识别系统,具体做法是,把一张没什么问题的图片分成九宫格发布,然后看看系统AI会不会屏蔽其中的一部分。然后得到了如下结果:
咳咳,该说点什么呢?你们看马德华老师表情做得多到位?
总之这张图说明了两件事:1. 用人工智能来鉴定色情内容已经成为社交网络的主流(肯定是AI干的,人才没这么蠢呢);2. 人工智能技术还有待提高……
上图这种问题,就是因为AI逐张审查图片时没有参照物,自然无法判断图上信息的性别,所以自然就屏蔽了。这可谓是AI鉴黄的死角,也说明有待完善的场景还非常多。
由于以上这种有点笨的AI已经广泛存在于我们使用的各种社交网络上,所以大家可能直觉上认为AI在成人内容领域就是扮演“监管者”与“垃圾清扫器”的角色。
其实吧,成人内容对于AI来说绝不仅仅是种清扫工作。正相反,如今AI正在利用成人与色情大幅度提升自身能力。甚至很多期待值非常高的技术,只能借助成人内容来进行训练。
是不是有点反常识?
其实假如我们在脑海中剔除对性和相关内容的莫名忌讳,会发现这个领域隐藏着机器通往智能的必经之路。
爱与恨催生了人类的艺术,战争和性进化了人类的技术,保不齐是个真理…
成人小说与对话式AI的自我救赎
为什么你家的智能音箱,经常被朋友嘲笑为“智障音箱”?
当然有很多原因。但原因之一在于,音箱里的对话式AI系统在跟你聊天的时候,只能冷冰冰的进行反馈。不会用修饰语、不会暗示、不会拐弯抹角、不会开玩笑。假如我们生活中有一个这样的人,大多数人对ta的评价一定是“无聊”。而这样的AI,当然很难让人有兴趣与之聊下去。
这事儿怎么破?
为了让AI的对话不再枯燥乏味,谷歌大脑团队在去年干了很有意思的一件事:训练AI读成人小说。
通过阅读大量爱情与色情相关描写,AI可以丰富与用户对话时的话语模式、讲述风格,并从不同角度来理解同一个问题。这样对话系统在语言风格上会更加自然,相对贴近与真人的对话体验。
其实仔细想一下,这么做是非常有道理的。大部分“正常”小说当中,会出现各种各样的场景、人物、道具和情节,这些东西AI理解起来还是比较费力的。把语言要素与描述的物体一一对应起来进行学习更是不可能。
而成人小说则不然。在这类小说中的重点情节里,翻来覆去无非就是几件事。但描述这些事的语言风格、修饰语运用和修饰技巧使用却是千奇百怪的……否则古今中外怎么会有那么多相关作品?
研究人员把这些书籍中的相关描写剪切下来,让AI逐个阅读。这样AI模型就会搞懂如何对其实很简单的动作和细节进行千奇百怪的描述。将这种能力抽象出来,变成对话式AI与人类交流时的通用能力,那么整个画风也自然会唯美很多……
仔细想一想,很难有更合适的人类文学素材来训练AI这个能力了。至于AI会不会从中学会调戏人类,目前还不得而知…
如何理解成人网站飙科技车?
今年10月,世界最大的成人视频网站之一Pornhub推出了基于机器学习的内容识别系统,成为国内科技媒体报道的热点。
事实上,Pornhub一直都被称为顺带手分享点成人视频的科技公司。如果你能登上这个网站的话(其实根据Pornhub的大数据,他们很多频道的主要流量都来自中国大陆地区用户),会发现他们不仅率先搞起了VR专区,还有模拟运动监督软件、性知识智能教学系统、智能硬件等各种黑科技计划。大数据和流媒体技术满天飞更是不在话下。
但需要提醒的是,国内很多媒体将Pornhub刚刚推出的机器学习识别系统称为“鉴黄师”……这个就有点不合逻辑了。一个成人视频网站要鉴黄师干嘛呢?这用不着AI,随便找个人站那拿手一指,在座的各位都是黄的……
事实上,这个AI系统的意义是用来升级网站的智能推荐系统。
目前Pornhub上的机器学习模型,可以对视频中的主演进行面部识别。并学习视频中的内容,比如场景是家中还是办公室、主演是丰满还是苗条、姿势是这样还是那样……
有了这些学习成果,再结合每位用户的搜索、点击和浏览数据,系统将准确判断出用户的爱好。从而智能推荐出用户想要的影片。
由于Pornhub上的视频存量已经可以用“无边无际”来形容。而大多数用户都还是通过搜索关键词来找到自己想看的内容。但即使是关键词搜索之后,内容也依旧太多。如何在这些内容里推给用户最想看的作品呢?
通过机器学习来识别每一部视频的标签,然后学习用户行为来深化用户画像,可能就成了最好的办法。一个人对成人视频的品味往往不是单方面的,而是多个因素(甚至包含不自知的因素)组成的网络化价值依据。去了解用户喜好的深层次因素并匹配相似结果,才是这个系统的精华所在。
怎么样,明白了吧?还没有,那好吧我们换个角度聊聊…..为什么那些资讯类的内容分发平台,以及视频网站的内容推荐,也让我们觉得很蠢?因为这些推荐机制基本全是基于关键词的(甚至是标题关键词)来完成的。这些内容跟你的深度契合点在哪里呢?sorry,平台不管的哦。
举例来说,某人阅读了一篇《东南亚渔民奴隶的生存现状》,那么系统接下来会推荐什么呢?最大的可能是:东南亚人妖、东南亚养小鬼、东南亚水果、东南亚旅游……
但其实呢,这位对人妖丝毫兴趣都没有,而是对特殊阶层的人类学田野调查有兴趣。假如系统会推荐一篇《利比亚的农奴大逃亡》,他就乖乖点开来看了。
但是,内容推荐系统是永远无法知道这两篇文章间是有联系的。因为这类内容太小众,系统的机器学习模型没有办法将之关联。
毕竟内容这东西实在太多了,无数人有无数爱好,系统没办法一一兼顾。但成人网站却成为了“内容太多”这个问题的有效解决方案。因为一个人对成人内容的喜好,大体都是由角色、体型、姿势等简单因素决定的,AI学习起来相对容易。运用到实践中速度也会很快。
所以,成人网站的机器学习飙车,或许可以理解为AI对人类内容深度理解的开始——这只是成人网站的一小步,却是人类的一大步。
每一次不可描述,都是给性爱机器人进行深度学习训练
2010年,很多如今的老司机还只是纯洁的小朋友,那时他们注意到了一个新闻:世界首款性爱机器人Roxxxy诞生了。
时至如今,这款机器人依然在坚强地行走在高端成人用品市场上。并且其中加入了人工智能交互系统,机器人可以和你聊天;可以给你提供各种暗示与帮助;拥有不同的性格和爱好…..甚至还能给你发邮件(我也不知道这个功能价值何在)。
与此同时,世界上其他地区的“AI性爱硬件”(姑且这么叫吧),也在不断成熟起来。日本、英国,甚至中国,都开始出现搭载AI交互的硬件产品。
这些产品的特点,大多是可以通过智能语音系统来与使用者互动,听从使用者的指令(据说有的硬件是专门不听指令),并通过呼吸、音量、心跳等信息来判断用户状态,给予声音、温度、频率等门类的反馈。
这种功能听起来也无非是高级的成人用品。但仔细想一想,以往的成人用品不管是什么花样,归根结底都是单向施用的。但AI的加入,史无前例的让整个过程变成了互动。
而互动的价值在于,AI可以通过学习和理解,来分析出相应的解决方案,并将之在真人身上进行验证。
在讨论AI读懂用户时,始终存在的问题在于传感器太少,无法全面收集用户信息。并且很多用户的关键信息不希望透露给AI,这也就让大量理解用户的技术成为空谈。但在性爱机器人身上,传感器完全可以多到不要不要的,并且用户也没有什么秘密可言了。
虽然性爱机器人一直都伴随着物化女性的非议以及很多伦理争论。但从技术的角度讲,每一次人机间的不可描述,都可以是AI系统对用户数据理解并反馈的完整训练闭环。
尤其要注意的是,智能语音的作用体是语言;机器视觉的作用体是图像;工业机器人的作用体是工业效率,而性爱机器人的AI——也唯有其身上的AI——作用体是人类本身。
AI真正理解人类,未尝不可能从此开始。
成人领域,AI脱掉信息枷锁的地方
思考这样一个问题,互联网第一次赚钱是在哪里?答案是,成人网站。
知识付费第一次赚钱是在哪里?答案是,反正是差不多的地方吧。
总之,新技术的成熟和商业化从色情领域开始,或许不仅仅是一个巧合。
AI与成人,或者说色情领域的结合,当然也可以看到Pornhub这种成熟商业化的代表性平台。但真正让观察者在意的,是通过与之结合,学习并理解成人内容,AI或许可以迎来技术应用上的某种成熟。
我们知道,AI技术创立伊始,核心思路就是让机器去模拟和学习人类的能力。但随着经典计算和现代计算机的发展,我们周遭的一切都被打上了信息化的标签。内容是数据构成的、工业是数据构成的、互联网更是数据构成的。
在这种情况下,机器学习为代表的“成长性”AI技术,利用的一切学习资料基本都是数据的衍生品。那么这种情况下得出的AI之果,是否已经偏离了最初模仿与学习人类的AI之因呢?
巧合的是,成人内容中却极大程度保留了原始、生理、简单的人类信息。相比于信息化和符号化的现代社会外衣,这个领域其实保留了相当程度的属于“人”的那部分真实。
比如说在成人网站上,用AI来探索用户的真实喜好;比如说用性爱机器人来探索一个人的情感与冲动,都已经被证明是可以尝试的办法。
AI想要进一步了解人类本身,或许先要开始脱掉一些信息组成的枷锁。让这个世界不仅是代码和关键词,还有更复杂也更简单的人性。
平视我们自己,是一件比平视AI更难的事。假如我们能够做到,至少文章开头处的猪八戒就不会变成那个样子了……摘掉一些莫名其妙的猥琐和畏惧,或许会发现通向AI之路的脑洞还有很多。
“上帝不是唯一的见证” ——此前有媒体在采访Pornhub总部时,发现办公室里有这样一句话。