Tumblr推AI鉴黄计划夺老司机“珍爱”,超30万人请愿撤回禁令

时间:2018-12-30 18:01:30 来源: 万达娱乐官网 作者:匿名


▲点击以上雷锋网关注

文字|周兴宇

雷锋报道

昨天是老司机和福利的结束,因为着名的美国博客网站Tumblr在同一天突然发起了一项新的政策决定。—— Tumblr将完全禁止任何成人内容,新规则将于12月17日正式实施。

这不是正义问题。什么可以是一个大惊喜?

与定义“和谐社区”的大多数人不同,Tumblr是一个以青年为中心的社交网络平台,以举办大量色情活动(主要是文章,静态地图和Gif地图)而闻名。

社交网站Tumblr截图

Tumblr创始人David Carp表示色情相关内容占该网站流量的2-4个百分点。 2012年,本月发表的一项意大利研究显示,这一数字正在快速增长,甚至近一半的网民都遇到了不可避免的成人内容,Tumblr没有回应这一评论。

今天,在雅虎的社交网站上,只有0.1%的帐户正在制作色情内容,22%或更多的用户关注,喜欢或转发上述帐户的内容。研究表明,正是这种“共享”行为导致另外28.5%的Tumblr用户无意中访问色情内容。

俗话说,经常沿着河边走,怎么会有湿鞋呢?

雷锋网了解到,就在两周前,苹果公司从其应用商店中删除了Tumblr软件,因为其检测和删除儿童色情内容的自动化系统失败了。从类型的角度来看,尽管Tumblr可以看到类似于天文地理和历史科学的“小清新”内容,但与前者相比,它只是冰山一角。

此时,Tumblr发起了一项人工智能计划,并在声明中郑重声明成人内容应该“被杀”。

Tumblr首席执行官Jeff D'Onofrio在一份声明中表示,Tumblr的AI黄色计划并不意味着禁止赤裸裸的政治抗议或大卫雕像。此操作要求AI具有强大的成人内容识别功能,同时依靠人员来帮助训练和控制系统。简而言之,Tumblr希望创建一个识别裸体女性的人工智能系统,但不会将裸体女性角色误认为成人内容。虽然这对人们来说非常简单,但人工智能的难点在于达到“让骨头进入鸡蛋”的程度。换来你是人工智能,看到这个场景有冲破街头的冲动吗?话虽如此,有些人会问,“为什么?”

实际上,AI识别图像的过程分为信息获取,预处理,特征提取;选择,分类器设计;分类决定了三个街区。在第一部分中,AI提取图片中的特征点并通过数据匹配获得其属性,最后生成决策。

也就是说,除了与成人内容相关的敏感词汇和特征点之外,为了使AI区分真人和雕塑,有必要在此基础上匹配特征点的材料的特征。困难在于初始AI只能根据指定的“标签”分析图像类型。无论图像中的物体是肉体还是大理石,塑料或泡沫......这个问题都无法准确分析。

一个简单的智能系统无法立即找出应该测量哪些标签以及哪些标签不值得在随机图片中进行测量。对应于Tumblr黄化计划中的这个问题,解决问题的唯一方法是尽可能完全捕获图片和文本中的特征点,这将是系统的巨大负担。

特征点识别

如何避免这么糟糕的循环?作为回应,Tumblr首席执行官Jeff D'Onofrio表示,该公司正在越来越多地投资于该政策的实施,包括行业标准机器监控,不断发展的手动仲裁团队以及用于报告滥用行为的用户工具。 。通过吸引更多用户和相关人员,Tumblr希望逐步开发人工智能系统,通过人工智能学习功能获得准确的筛选功能。

除了人工合作外,雷锋还向图兹普技术总监蒋泽荣提交了一篇题为《世界最大黄网要用 AI “鉴黄”,还号称要让鉴黄师下岗》的文章。他的回答是:“如果这是一个1.5小时的视频,一秒钟。基于上面视频数量的截图足以开发出一个好的模型。”从这个角度来看,虽然Tumblr识别图像和文本,但这种规模社交网站(不仅仅是类似的东西)自然地训练了“可用的”AI黄化系统。下。

既然这不是问题,为什么还有很长的路要走呢?从目前的影响来看,尽管Tumblr在声明中明确指出,它将重点关注培训人工智能以筛选性取向和色情内容的能力,以避免前者被认为是不恰当的。但反馈说,意外删除甚至包括加菲猫照片,蝙蝠侠吃法兰克福照片和电视厨师戈登拉姆齐胸前拿着一个年糕,称之为“大乳房”照片。AI:嗯?这太灰了,往往不适合屏蔽!

纽约自由摄影师Laura Thompson说我必须手动上诉团队解锁图像,即使我在网站上发布的标签确实是“色情”(例如“食物色情”),但显然他们与色情内容无关。

从成本角度来看,Tumblr的社交网站属性不断涌现,要求AI Jianhuang系统具有强大的GPU计算能力,高速的端到端图像处理速度和高带宽标准。在雷锋的文章《AI 会让鉴黄师失业吗?》中,有人提到:“就计算能力而言,当GPU是单摄像头单卡时,最初的数千万个样本经过近一个月的训练,通常只有10,000张图像。为了识别这张照片,人工智能扫描的成本是10,000倍。“可以看出,AI Jian Huang确实是一个庞大而费力的项目。

从风险因素的角度来看,人工智能程序的实施伴随着各种其他风险。首先,用户属性AI Jianshi必须尽可能地尝试在平台上获取各种数据,没有人能够保证数据最终流向何处(尽管每个人都说“我们绝对安全”)。

3月16日,Facebook曝光了。 2014年,Cambridge Analytics Inc.非法使用超过5000万用户数据发送政治广告。事件曝光后,Facebook的市值在一天内消失了60亿美元。 3800亿元)。虽然Facebook一直处于混乱状态,但其首席执行官马克扎克伯格否认该公司打算侵犯用户隐私并参与多项听证相关交易。我们不知道真相是什么,直到真相浮出水面,但它足以证明——。当您尝试为某些目的开始收集和使用用户信息时,甚至不要考虑在发生事故时清除您的清白。短期影响,长期成本和风险因素。对于Tumblr,AI Jianhuang系统与成人视频网站不同。除了有效过滤成人内容之外,您还需要过滤掉正常的对话并将其推荐给所有人。这个问题的难点有点,我给五颗星!可以看出,Tumblr的AI黄化计划可以说是一条漫长的道路,但现在我们只看到一条规则,一切都将在12月17日出现。

- 结束 -

推荐阅读

关于“AI投资研究”

雷锋的成员组织专注于AI 10大领域:AI Auto(智能驾驶),AI教育,AI Finance,AI智能城市,AI Security,AI Healthcare等。早鸟限量版999,欢迎加入。