文字工作不容易

2013-07-03 06:08 by 糖和尚 | 评论(8)

tech porn

我有一个拍立得相机，和别的拍立得相机一样，里面住着个小鬼，由于对包括相机功能在内的很多事情持有不同意见，我们相处得不甚融洽。我认为它不是一个好相机。

这一点很明显：

别的相机拍照时，按下按钮，小鬼就把镜头里看到的东西唰唰画出来，基本准确，相当迅速。

这个相机按钮按下后却没有反应，凑近些会听到点儿窸窸窣窣的声音，然后就是等待，等待中的时间是一团混沌，身处其中你什么都不知道，不知道该干什么，不知道过了多久，最后连这是一团混沌还是一碗馄饨都搞不清。好歹等到它输出结果，却不是照片，而是吐出一张纸条，上边“以人类语言书写”，“准确描述了快门按下时镜头前的场景（小鬼自己的原话）”。

就是说，这是一台文字型相机……

于是，我拍街上见到的漂亮姑娘，得到了一张写着“一大群人”的纸条；

我拍现当代的艺术画作，得到了写着“长方形，圆形，以及不规则图形”的纸条；

我拍冬天深沉的大海，得到了“一大锅咸水”纸条；

我不甘心，再拍，得到了“泛着搓下来的泥垢和死皮的白沫，地狱中的老年巫婆公共浴池”纸条；

我倔劲儿上来，拍第三次，得到了又一张写着“一大群人”的纸条；

（海滩上空无一人，它大概是对焦对到大洋彼岸去了）

……

最后我把它对着镜子，得到了写着“这是一个好相机”的纸条。

就连相机也可以跟你对着干，这是生活在魔法世界的坏处。

但是在一个相机依靠半导体芯片和光学镜头而非小鬼驱动的世界里，这件事需要重新叙述如下——

Matt Richardson 有一个相机的点子。他设想的这种相机，在拍摄照片的同时，能够根据图像内容自动添加注释。现代数码相机可以在照片中储存拍摄参数、日期乃至经纬度信息，Matt Richardson 的这种相机更进一步，能“识别理解”所拍摄照片的内容——人物、事件等——并将这些信息附加在照片文件中，方便索引和查询。

当今的人工智能发展水平离完全识别理解照片内容还有一段距离，不过 Matt Richardson 做了个有趣的半智能原型机 The Descriptive Camera 。原型机由三部分组成，BeagleBoard 单板电脑，USB 摄像头，打印机。按下“快门”后，摄像头拍摄照片，自动通过电脑上传到某个任务网站，自动发布任务，要求任务领取者对照片进行描述，最后将得到的文字描述用打印机打印出来。

Matt Richardson 表示，描述照片任务的报酬设定1.25美元/次的话，一般在6分钟内能得到结果。

还少一个大大的按钮，上面写着‘不要恐慌’