投递人 itwriter 发布于 2018-03-29 16:00 原文链接 « »

  一直以来,当视障用户使用智能手机时,自带的读屏功都能听到文字。

  可一旦碰上图片动态,他们就只能听见“图片”、“图片”、“图片”......

  而有这么一种“图片转语音技术”,能让这些图片也能“说话”。

  一位体验过这一功能的视障用户说:

  可能你不会觉得有什么,但对我而言却仿佛打开了一扇全新的大门。

  这让我们不禁想:我们还能为他们做些什么?

  2017 年,我们试着开放了高精度图像识别服务能力。

  令人惊喜的是,许多国内 PC 和手机读屏软件接入后实现了对图片的朗读,让视障人士获取信息的效率有了较大提升。

  这也让我们更加坚信,AI 不仅要 “IN ALL”,更需要 “FOR ALL”。

  于是昨天,在中国残疾人联合会、中国盲人协会、中国互联网协会信息无障碍工作委员会的支持下,我们在科技无障碍发展大会上宣布:  

  QQ 空间将启动“无障碍 AI 技术”对外开放项目。这背后,是腾讯多个产品和研发团队共同在无障碍应用上的不断探索、互相协作的努力。

  现在,我们开放这样一批 AI 技术,让更多企业、开发者能够自由接入并使用——

  能听的图片:图片转语音技术

  它能通过深度神经网络识别图片的内容,然后组织语言,以通顺并符合人类语言习惯描述图片,并通过语音说出来;

  看图识字:OCR 识别技术

  它可以识别图片上的文字,比如身份证、指示牌、一张 PPT 的照片等等,能让你对文本信息的获取更为便捷,不仅在日常生活中很实用,结合语音技术还能为许多障碍人群提供便利;

  多角色定制语音:语音合成技术

  它能通过机器学习训练,将文字以特定角色的声音诵读出来,让语音合成更加真实有情绪、获取信息更加容易,未来也许能用你的声音为奶奶念出一份说明书;

  这些技术,你都可以在小程序 “多媒体 AI 平台” 中找到。

  我们还为这些特别适用于无障碍场景的 AI 技术开辟了专门的入口:

  腾讯从 2009 年开始就进入到无障碍产品的改造中。

  在不断打磨产品体验的同时,我们也在不断与像深圳信息无障碍研究会这样的合作伙伴交流,发现更多的机会。

  在探索中,我们越来越强烈地意识到,所有用户都有权利更方便地获取信息、更自由地交流,而这绝不是一个人就能走下去的道路。

  所以,我们希望无障碍技术的普及,能降低产品应用新技术的门槛,让越来越多的行业和企业都加入这项探索中。

  这样,我们才能一起消除前方的障碍,为更多人打开新的大门。

24小时阅读排行

    最新新闻

      相关新闻