我有一个拍立得相机,和别的拍立得相机一样,里面住着个小鬼,由于对包括相机功能在内的很多事情持有不同意见,我们相处得不甚融洽。我认为它不是一个好相机。
这一点很明显:
别的相机拍照时,按下按钮,小鬼就把镜头里看到的东西唰唰画出来,基本准确,相当迅速。
这个相机按钮按下后却没有反应,凑近些会听到点儿窸窸窣窣的声音,然后就是等待,等待中的时间是一团混沌,身处其中你什么都不知道,不知道该干什么,不知道过了多久,最后连这是一团混沌还是一碗馄饨都搞不清。好歹等到它输出结果,却不是照片,而是吐出一张纸条,上边“以人类语言书写”,“准确描述了快门按下时镜头前的场景(小鬼自己的原话)”。
就是说,这是一台文字型相机……
于是,我拍街上见到的漂亮姑娘,得到了一张写着“一大群人”的纸条;
我拍现当代的艺术画作,得到了写着“长方形,圆形,以及不规则图形”的纸条;
我拍冬天深沉的大海,得到了“一大锅咸水”纸条;
我不甘心,再拍,得到了“泛着搓下来的泥垢和死皮的白沫,地狱中的老年巫婆公共浴池”纸条 ;
我倔劲儿上来,拍第三次,得到了又一张写着“一大群人”的纸条;
(海滩上空无一人,它大概是对焦对到大洋彼岸去了)
……
最后我把它对着镜子,得到了写着“这是一个好相机”的纸条。
就连相机也可以跟你对着干,这是生活在魔法世界的坏处。
但是在一个相机依靠半导体芯片和光学镜头而非小鬼驱动的世界里,这件事需要重新叙述如下——
Matt Richardson 有一个相机的点子。他设想的这种相机,在拍摄照片的同时,能够根据图像内容自动添加注释。现代数码相机可以在照片中储存拍摄参数、日期乃至经纬度信息,Matt Richardson 的这种相机更进一步,能“识别理解”所拍摄照片的内容——人物、事件等——并将这些信息附加在照片文件中,方便索引和查询。
当今的人工智能发展水平离完全识别理解照片内容还有一段距离,不过 Matt Richardson 做了个有趣的半智能原型机 The Descriptive Camera 。原型机由三部分组成,BeagleBoard 单板电脑,USB 摄像头,打印机。按下“快门”后,摄像头拍摄照片,自动通过电脑上传到某个任务网站,自动发布任务,要求任务领取者对照片进行描述,最后将得到的文字描述用打印机打印出来。
Matt Richardson 表示,描述照片任务的报酬设定1.25美元/次的话,一般在6分钟内能得到结果。
根据返回的描述打印出来的纸条。
一个简单的演示视频:
视频链接(pad 和手机用户可尝试点击)
几张发到任务网站的照片和它们收到的描述。
“似乎是一个橱柜,难看,旧,抽斗上贴着铭牌,柜子连着一个台灯”
“铺着木地板的房间一角,有工具箱,单车,一摞书,靠在墙上的长条盒子,一扇门开着,门把上挂着一个袋子,另有一些线缆挂在一个对开壁橱的把手上”
[ The Descriptive Camera ,来源:notcot ]
视频:
魔法世界!1973年的实验短片,Peter Campus 的《Three Transitions》。
视频链接(pad 和手机用户可尝试点击)