Craig Federighi detalla la colaboración de Apple con Google para Siri AI en iOS 27


El equipo Siri de Apple, dirigido por Craig Federighi, celebró esta tarde una conferencia tecnológica posterior a la WWDC con miembros de la prensa para discutir iOS 27 y la nueva Siri AI.

Durante la conferencia, Federighi compartió más detalles sobre la colaboración de Apple con Google.

A Federighi se unieron Amar Subramanya (vicepresidente de IA), Mike Rockwell (director de Siri) y Sébastien Marineau-Mes (vicepresidente de software).

Respecto a la colaboración con Google, Federighi explicó:

Por supuesto, no tenemos la aplicación Gemini como aplicación. De hecho, ninguno de estos códigos de cliente forma parte de cómo trabajamos en iOS. Para estos modelos, no utilizamos ninguno de los modelos que Google implementa para sus clientes, ni utilizamos la infraestructura y los medios mediante los cuales ellos implementan modelos para sus clientes. Y luego, en lo que respecta a la base de conocimientos, por supuesto, no utilizamos la búsqueda de Google ni nada por el estilo como base de nuestro sistema. Así que espero que quede claro. La cantidad de Asistente de Google que utilizamos es cero.

Entonces, hablemos de lo que usamos o cómo está construido nuestro sistema.

Por supuesto, esto comienza con nuestra experiencia como Asistente. Y como vio hoy, esta experiencia del Asistente está profundamente integrada en el sistema, en iOS, en iPadOS, en macOS. Viste en el iPhone cómo surge el asistente, creo que de manera realmente hermosa, en Liquid Glass fuera de Dynamic Island, cómo puedes invocarlo desde el botón lateral o hablando con Siri por su nombre. Pero aún más, está integrado en todo tipo de lugares del sistema. Entonces, ya sea que esté escribiendo con las herramientas de escritura o haciendo clic en el menú contextual, todo está profundamente integrado en la experiencia del sistema.

Ahora la aplicación Siri está conectada a él. La aplicación Siri es una excelente manera de regresar a una conversación que ya inició, revisar lo que hizo anteriormente, extender esa conversación o iniciar una nueva. Pero esta aplicación no es sólo para un modelo en la nube. Se basa en el potente software del sistema de Apple Intelligence.

Esto incluye System Orchestrator, que es clave para la arquitectura de privacidad de todo nuestro sistema. Es lo que coordina las solicitudes con cosas como App Toolbox, que proporciona acceso a acciones dentro de sus aplicaciones, Spotlight Semantic Index para acceder a contenido personal que le ayudará a cumplir con su solicitud, e incluso cosas como el contexto en pantalla para comprender lo que está viendo en el momento de realizar una solicitud.

Esto, a su vez, se basa en un conjunto de potentes plantillas integradas en el dispositivo. Estos manejan todo, desde comprender el habla hasta sintetizar la voz que le responde, comprender visualmente el entorno y el contexto en la pantalla, comprender si hay algo relevante allí, comprender el texto que podría estar en la pantalla, así como una gran cantidad de otros modelos.

Y para algunas solicitudes, los modelos pueden procesar sus solicitudes de Siri completamente localmente en el dispositivo. Pero a veces System Orchestrator se da cuenta de que se trata de un tema más complejo y luego quiere confiar en una mayor inteligencia. Para ello, contacta con nuestros modelos que se ejecutan en Private Cloud Compute.

El objetivo de Private Cloud Compute es extender la misma promesa de privacidad del iPhone a la nube, de modo que sus solicitudes sean completamente privadas para usted. Nunca se almacenan, nadie puede acceder a ellos, incluido Apple, solo se procesan como parte de la solicitud y nada puede acceder a ellos. Todas estas propiedades no sólo están integradas arquitectónicamente en lo profundo del sistema, sino que también son algo que investigadores externos pueden verificar continuamente.

Ahora, en este modelo de implementación, tenemos una familia (nuestra tercera generación) de plantillas de Apple Foundation, desde nuestras plantillas AFM Cloud y AFM Cloud Pro hasta nuestra plantilla AFM Fusion y nuestra plantilla Image. Estos son los modelos que son producto de nuestra colaboración con Google y escucharás más sobre ellos a medida que avancemos. Pero estos están diseñados para funcionar en nuestra arquitectura de implementación. Estas son plantillas diseñadas específicamente para nuestros experimentos de Apple Intelligence. Ellos son los que impulsaron todo lo que vieron en la presentación principal de hoy.

Finalmente, cuando realiza una solicitud sobre eventos actuales u otro conocimiento mundial, esas respuestas se basan en el acceso al World Knowledge Service de Apple. Esto es algo que hemos construido durante muchos años y es una gran fuente de información para satisfacer su solicitud.

Por lo tanto, este sistema admite toda la gama de experiencias de Apple Intelligence que vio anteriormente. Espero que esto también base nuestra discusión. Y lo que nos gustaría hacer ahora es incorporar a los miembros del equipo de liderazgo que ayudaron a trabajar en todo esto.

Subramanya elaboró:

Estamos muy entusiasmados con nuestra tercera generación de Apple Foundation Models, o AFM, en asociación con Google. Hemos creado una familia de modelos que abarca desde el dispositivo hasta la nube. Ahora, antes de revisar cada uno de los modelos de la familia, lo principal que diría para esta generación es que cada modelo es significativamente superior en calidad y capacidad en comparación con nuestra generación anterior.

A medida que avancemos en cada uno de los modelos, comenzaremos con nuestros modelos en el dispositivo. En primer lugar, tenemos AFM Core. Esta es la próxima generación de nuestro modelo integrado que ofrecemos en los dispositivos actuales. Sigue la densa arquitectura.

Y luego tenemos AFM Core Advanced.

Esto no se parece a ningún modelo de dispositivo que hayamos usado antes. Utiliza una arquitectura dispersa y es nativamente multimodal. Y como resultado, un gran salto adelante en las capacidades de este modelo, permitiendo algunas de las funciones de las que escuchó esta mañana, como invitación y voces expresivas, todas funcionando completamente en el dispositivo gracias a este modelo.

Pasemos a nuestros modelos de servidores, todos los cuales funcionan desde nuestra Computación en la Nube Privada. En primer lugar, tenemos AFM Cloud. Este es nuestro modelo de trabajo duro en el servidor. Básicamente, está optimizado para la latencia y el costo del servicio.

Y luego tenemos AFM Cloud Image. Este es nuestro modelo de generación y edición de imágenes de próxima generación y, como saben, permite una serie de experiencias asombrosas, incluidas cosas como el recorte espacial, del que también escucharon esta mañana.

Y los cuatro modelos de los que acabamos de hablar, FM, Core, Core Advanced Cloud y Cloud Image, son compilaciones personalizadas para Apple Silicon, entrenadas con datos patentados y refinadas con modelos de frontera Gemini.

Finalmente, para algunas de las tareas más exigentes, como el uso de herramientas de agentes y razonamientos complejos, tenemos AFM Cloud Pro. Este es nuestro modelo de mayor rendimiento con una calidad similar a la de los modelos Gemini Frontier.

Y para llevar este modelo a producción, estamos trabajando con Google y Nvidia para extender nuestra infraestructura de Private Cloud Compute a las GPU NVIDIA en la nube de Google, manteniendo al mismo tiempo las inigualables garantías de privacidad de Apple, ¿verdad?

Entonces, en toda esta familia de modelos, nuestro objetivo es hacer coincidir cada solicitud de usuario con el modelo que proporciona la mejor respuesta con la latencia más baja. Por eso, juntos, estamos muy entusiasmados con esta nueva generación de modelos y las increíbles funciones que nos permite desarrollar sobre ellos, incluida la nueva experiencia Siri AI y todas las increíbles experiencias inteligentes en todo el sistema operativo.

Más por venir…

Los favoritos de Chance:

Seguir oportunidad: Temas, cielo azul, InstagramY Mastodonte.

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.





Fuente