AI周报：自然语言处理、计算机视觉、机器学习最新进展146

自然语言处理* OpenAI发布Whisper，一款新的语音识别模型：Whisper在各种数据集上都取得了最先进的结果， включая LibriSpeech、TIMIT和Wall Street Journal。它可以在不进行微调的情况下转录超过90种语言的长格式音频。
* 谷歌研究人员开发出一种新方法，可以训练神经网络从文本中生成图像：这种新方法称为神经放射学，它允许神经网络学习从文本描述中生成高质量的图像。
* Facebook AI推出FLAVA，一种用于理解视觉文本的新模型：FLAVA使用多模态Transformer架构，可以从文本和图像中联合学习，比以前的方法取得了更好的结果。

计算机视觉* 微软研究人员开发出一种新算法，可以检测和定位图像中的3D对象：该算法使用一种名为深度估计生成式对抗网络（DE-GAN）的深度学习模型，可以准确地检测和定位图像中的3D对象。
* 谷歌研究人员推出了一种新方法，可以生成高质量的图像超分辨率：这种新方法称为真实感增强生成网络（RealESRGAN），它使用生成对抗网络（GAN）来生成比以前的方法更逼真的高分辨率图像。
* OpenCV发布4.6版，增加了对深度学习的支持：OpenCV 4.6添加了对深度学习框架的支持， включая TensorFlow和PyTorch，使开发人员可以轻松地将深度学习集成到他们的计算机视觉应用程序中。

机器学习* 谷歌推出了Ignite，一个用于机器学习的低代码平台：Ignite允许开发人员使用预先构建的模块快速构建和部署机器学习模型，无需编写代码。
* 亚马逊网络服务（AWS）发布SageMaker Autopilot，一种用于自动机器学习的托管服务：SageMaker Autopilot使用机器学习算法自动执行机器学习模型开发过程，使开发人员可以专注于构建应用程序。
* 微软研究人员开发出一种新方法，可以优化大规模机器学习模型的训练：这种新方法称为分布式数据并行性（DDP），它允许在多个计算节点上训练模型，从而显着缩短训练时间。

其他AI新闻* 欧盟发布《人工智能白皮书》，概述其对人工智能的愿景：白皮书概述了欧盟对人工智能的愿景，包括其支持创新的计划，同时确保其负责任和道德的发展。
* 世界经济论坛发布《人工智能影响力指南》：该指南提供了有关人工智能对社会和经济的影响的全面概述，并提出了减轻其负面影响的建议。
* 联合国开发计划署（UNDP）启动了人工智能全球中心：该中心将作为人工智能领域的全球枢纽，促进人工智能的负责任和可持续发展。

2024-12-22

上一篇：人工智能与人类共生：迈向和谐未来的展望

下一篇：AI 工具面板：赋能专业人士工作流的强大助手