印度夫妻将人工智能装进手机 皱眉即可拒听电话
阿什维尼·阿索肯和阿南德·钱德拉塞卡兰
据亚洲科技报道,这个影像识别平台叫做MAD Stack
你是否能想得到,有一天,当一个你不想接的电话打进来时,只要对着手机皱眉就能立即拒听这个电话,或者抬一下眉毛就能给来电者发送一条信息,问“什么事?”
还有,那只“会说话的汤姆猫“,不需要你说一句,他重复一句,现在,你可以不说一个字,只要一个鬼脸,它就能做出反应。
一对印度夫妻他们的创业事业正在朝这个方向努力,不,应该说,他们成功了。
他们是,阿什维尼·阿索肯和阿南德·钱德拉塞卡兰,两个孩子的父母。近日,亚洲科技采访了这对夫妻。
阿索肯曾在英特尔公司的交互体验实验室(IXR)带领着一支移动创新团队。这个团队里的设计师、人类学家和工程师正在探索移动技术的未来。而刚刚完成斯坦福大学神经形态工程(建造模拟人类大脑的计算机芯片)博士后研究的钱德拉塞卡兰,是基于神经系统科学的项目的咨询顾问。斯坦福的三年正是他沉浸于人工智能的时候。他是创建了神经网格——实时模仿一百万个神经元的一个系统——团队的一员。他还设计和模拟了一个可以映射大脑可塑性(根据经验发生改变)的一个芯片。
在回到印度之前,他们都在硅谷工作,那里是科技创业的天堂。但是他们觉得在那里生活成本太高,而且他们有两个孩子,一个正咿咿学语,还有一个正在蹒跚学步。所以经过无数的思想斗争后,这对夫妻决定打道回府,回到家乡印度金奈,在那里开创自己的公司。
在他们创业之前,夫妻俩相信有足够的能力与智力来实现这个梦想。在硅谷的时候,他们估计将要花一到两年的时间来建立这个技术。
回到印度不到一年,夫妻俩的初创公司Mad Street Den就在基于云技术的一个平台上开始上马运行了。这个平台利用人工智能,使装有摄像头的智能手机能识别人脸,检测面部表情和情绪,并对面部和头部动作作出反应。而这个人工智能摄像头有什么“特异功能”呢?就如文章开篇所说的那样,可以通过表情发送信息、接听或者掐断电话。
据亚洲科技报道,这个影像识别平台叫做MAD Stack,应用软件开发者和公司能利用它来开创一种未来的移动用户体验。“这个想法就是希望让机器更人性化从而让它们更有用,有趣、智能。我们利用计算机视觉来达到这个目的。”阿索肯告诉亚洲科技。
对人脑来说,识别人脸并对一个姿势作出反应是轻而易举的,但对一个智能手机摄像头来说,数字化处理这个过程就非常复杂了。人工智能让摄像头做到了这一点。此外,通过机器学习算法,这个应用变得越来越智能。
这是一项争议颇多的技术
计算机视觉是一项争议颇多的技术。不管是科幻小说还是科幻电影,这样的技术总是既让人感到恐惧但同时也备受称赞——从无处不在窥探市民的“老大哥”(来自乔治奥威尔小说《1984》)监视屏, 到外星人伪装成机器的“变形金刚”。
“这项技术有无数有趣的地方,为什么外行人听到的老是消极的一面呢?阿南德和我想要改变人们的看法,”阿肯索说。“我们的目标就是让围绕在计算机视觉的谈论远离监督、安全,还有所有耸人听闻的东西,我们要让它变得有趣。”
但事实上,在计算机视觉应用领域,竞争早已开始。
阿肯索列举了一大堆关于这项技术的应用,有的已经做出来了:亚马逊新开发的Fire Phone智能手机能识别条形码、盒子艺术,甚至电视音频,并帮助你发现你想要的东西。如果一台手机能识别条形码,为什么不能识别一张孩子的脸呢?这如果用在一款好玩的游戏里又会怎样呢?
在商业用途上,这样一种能力可以把客户分析提升到一个新水平。亚马逊标榜为“类固醇的可视化搜索”的Firefly,也仅仅只是一个开始。Mad Street Den承诺将为智能手机带来更多类似的视觉搜索技术。它的物体识别功能将成为印度电商Flipkart、Snapdeal等与亚马逊竞争的一个巧妙的手段。
全球的技术专家都在计算机视觉上做着努力。像亚马逊的Fire Phone智能手机、Facebook的Oculus Rift虚拟现实眼镜和其中国的竞争对手ANTVR,这些“一体化通用虚拟现实装备”新发明现在正霸占着各家新闻头条。甚至有一家叫Blue River的初创公司,用计算机视觉来识别有机作物田地里的野草,然后筛选出来将其铲除。这些需要昂贵的硬件装备,到目前为止,只限于少数能支付得起它们的人。
Eye Tribe是一家位于哥本哈根的创业公司,其在眼睛控制移动设备和电脑上享有专属软件。这家公司声称,这款软件能对网页和应用实现免手动导航,可以实现眼睛激活登陆,提高游戏体验,和云端用户使用分析。但该款软件还需要硬件组件来运行。公司的计划是和希望整合这些性能的硬件制造商合作。三星的Galaxy S4手机内置了一项眼球追踪功能,利用前置摄像头来跟踪用户的眼球移动。如果你看向别处,它就会暂停正在播放的视频,当你看向屏幕时,它就会继续播放。它会根据你的眼睛在屏幕上的动作来上下滚动网页和邮件,让手机屏幕处于睡眠或启动状态。
位于纽约的IMSRV公司是这个领域的另一个竞争者。IMSRV开发了使用网络摄像头来测量人们情绪的技术。公司可以利用这项技术来分析面部表情,再利用这些信息提高他们的业务操作和精准数字广告的投放。
让人工智能带给人类的是快乐
让我们回到Mad Street Den的这对夫妻俩上来吧。
这是他们在开始计算机视觉应用之前所能看到的:钱德拉塞卡兰曾经在人工智能硬件方面工作过,在硅谷设计类似大脑的芯片。但对人工智能的世界观(或者说人工智能更柔软的一面)让这对夫妻在那些夜晚促膝长谈。让阿肯索烦心的是那些关于机器人杀手、飞车警察、还有占领世界的机器之类的偏见之谈。这些数十年前就出现在科幻小说或电影里的预言没有一个成为现实。人工智能的另一面——有用的、在日常生活中的伟大应用又是怎样的呢?
因为离这项技术是如此的接近,阿索肯和钱德拉塞卡兰深知什么才是可能的。不仅如此,身为父母的他们更清醒地注意到对孩子们进行狂轰滥炸的漫画书、电影和电脑游戏中关于科技的错误叙述。阿肯索特别希望能改变这种现象。“我曾经和阿南德说,‘你在人工智能硬件领域工作,这很棒,但这不能让那些说法变得更积极、更真实、和更有趣。除了监视你,除了恐吓你,除了要杀你,还有其他的东西,不是吗?’”
所以,除了潜在的电商用途外,MAD Stack还可以用来开发更多沉浸式游戏,提供更好的社交媒体体验,和帮助移动数据分析。
比如说很受欢迎的儿童游戏,会说话的汤姆猫,孩子对这一只叫汤姆的猫说话,这只猫就会用一种傻乎乎的声音重复孩子的话。Mad Street Den可以在这款游戏中加上另外一种功能,让这个软件能识别孩子的表情。然后汤姆猫就能用做鬼脸来回应。“孩子玩这个游戏玩的不亦乐乎,”阿肯索说。她的女儿在Mad Street Den网站上做演示,她对着摄像头做各种各样的表情,摄像头识别了这些表情并能模仿它们。
MAD Stack同样也能让学习变得有趣。阿索肯和钱德拉塞卡兰正在和一位儿童教育材料开发商洽谈。这位开发商从这项技术上看到了许多机会。
Mad Street Den的计算机视觉平台只是将人工智能应用到日常生活,并给普通人带来欢乐的第一步。现在它拥有一款能让其他开发者插入的软件开发工具包。所以我们期待着这样一个未来——那时候将有各种各样令人愉快的人工智能设备——这正是“疯狂”的真正所在。