借助机器学习 Edge浏览器现可自动生成图片描述

今年年初，适用于 Windows 10/11 系统的 Microsoft Edge 浏览器引入了基于人工智能和机器学习的文本预测功能。而发布的公告中，微软宣布借助机器学习算法提供自动生成的图像标签。这项功能将会给视力障碍患者带来帮助，减少由于没有图片注释而带来的差距。

对于视力障碍患者来说，上网浏览网页时往往需要借助屏幕阅读器。然而，这样做的挑战是，如果网络上的图像没有替代文本，屏幕阅读器就不可能解释图像并给出准确的描述。

有鉴于此，微软 Edge 想出了一个变通的办法，即图像的自动生成的替代文本。它的主要目的是通过帮助屏幕阅读器解释所显示的图像的含义和意义，来提高屏幕阅读器的用户体验。

你所需要做的就是为屏幕阅读器打开从微软获取图像描述的功能来访问这个功能。然而，在描述时，算法可能并不准确，而且可能有所不同。一旦你打开这个按钮，未标记的图像将被自动发送到 Azure 认知服务的计算机视觉 API，以便由Microsoft Edge处理。

在处理过程中，视觉API会分析并创建5种不同语言的图像描述。此外，它还能够识别超过120种不同语言的图像中的替代文本。

然而，这个系统有一些局限性，即它可能无法处理某些图像的描述，例如。

● 被网站作者标记为"装饰性"的图像。装饰性图片对网站的内容或意义没有贡献。

● 小于50×50像素的图像（图标大小和更小的）。

● 过大的图像

● 被Vision API归类为色情性质、血腥或有性暗示的图像。

用户可以通过一个名为AccessibilityImageLabelsEnabled的企业策略设置来控制这一功能，你可以禁用它。它目前适用于Windows、Mac和Linux用户。目前还没有迹象表明它何时会应用于Android和iOS用户。

分享到：