加速图形处理以及更多其他操作
无论是要构建图形密集型应用、制作视觉效果精美的前沿游戏,还是打造专门处理机器学习等对计算要求极高的工作负载,Metal 都能让你轻松利用 Apple 设计的 GPU 的先进功能。在 iPhone、iPad、Mac、Apple TV 和 Apple Vision Pro 上,充分利用 Apple 芯片的惊人性能和超高能效。
无论是要构建图形密集型应用、制作视觉效果精美的前沿游戏,还是打造专门处理机器学习等对计算要求极高的工作负载,Metal 都能让你轻松利用 Apple 设计的 GPU 的先进功能。在 iPhone、iPad、Mac、Apple TV 和 Apple Vision Pro 上,充分利用 Apple 芯片的惊人性能和超高能效。
Metal 是一个将图形和计算紧密集成的现代化 API,提供了强大的着色语言,专为 Apple 平台设计并进行了优化。其低开销模型让你可以直接控制 GPU 执行的每项任务,从而最大限度地提高图形和计算软件的效率。Metal 还提供了一套出色的 GPU 性能分析和调试工具,帮助你提升性能和图形质量。
现在,一旦 Metal 库构建完成,便能在 Mac、iPad 和 iPhone 上直接部署,无需重新编译,从而为你节省宝贵的迭代时间。Metal 设备初始化过程也得到了简化,让你能够使用相同的代码适配这些平台。
无论是移植现有的游戏还是正在开发的游戏,都能加快进度。借助游戏移植工具包 2,你将能轻而易举地将高端游戏移植到 Mac、iPad 和 iPhone,并为玩家提供出色的体验。
现在,当你使用 Metal 着色器转换器来转换着色器时,可以充分利用 Xcode 着色器调试工具,这些工具现在还支持调试原始源代码。还可以使用 GPU 二进制编译器来构建所有着色器阶段 (包括网格着色器),能让它与所有通过 Metal 着色器转换器转换的着色器兼容。
凭借全新的 Metal Residency Set API,GPU 对 Apple 芯片统一内存的访问速度提升到前所未有的水平。将相关资源分组到内存集,确保它们共同驻留在内存中。
Apple 芯片支持硬件加速光线追踪。全新 Metal 光线追踪支持直接状态访问,可以避免额外的相交结果副本,从而解锁更多性能。在移植着色器时,还可以利用行优先的矩阵布局。
Metal 提供了一种强大的着色语言,可以充分利用 Apple GPU。今年,你将能利用新增的全局资源绑定功能,在全局范围内声明缓存、纹理和采样器,然后在着色器中的任意位置使用它们。你还可以进一步控制内存一致性,包括支持协作线程组算法的设备一致操作,以及使用 os_log 从着色器中输入日志到控制台。
利用新功能,将机器学习 Transformer 模型集成到 Metal 流程中,进而提升计算效率、带宽使用和模型质量。然后,使用全新的 MPSGraph Viewer 直观查看序列化的 MPSGraph 软件包,分析优化网络的可能性。
借助 MLX、TensorFlow、PyTorch 和 JAX,直接在 Mac 上加快机器学习模型的训练。随着 Metal 后端的改进,你不仅可以训练 HuggingFace.co 的前 50 个网络模型,而且能够利用 Meta 的 ExecuTorch 框架中新增的 GPU 加速技术,无缝部署包含自定 Metal 操作的 PyTorch 模型。还可以通过 JAX 框架来充分利用混合精度训练。
MLX 是一个高效灵活的阵列框架,专为 Apple 芯片设计和优化。借助 Metal 后端,MLX 框架可加快 Apple GPU 上机器学习模型的训练和部署。MLX 在 Python、Swift 或 C++ 中提供,并且可以在任何支持 Metal 的 Apple 平台上使用。
浏览文档、开发者工具、示例代码和视频,以进一步了解 Metal。