Meta presento un modelo de inteligencia artificial (IA) que puede seleccionar elementos individuales en una imagen. Lo llaman SAM, sus desarrolladores explican que pretenden democratizar un aspecto clave de la visión artificial con el sistema.
Esta nueva IA permite lo que se conoce como “segmentación”, la capacidad de identificar qué píxeles de una imagen pertenecen a un objeto en particular. El funcionamiento de SAM es muy sencillo: basta con hacer clic en el elemento que desea seleccionar o introducir su nombre. En una demostración, al señalar la palabra “gato”, la herramienta dibujó cuadros alrededor de varios gatos que aparecían en las fotos.
En un comunicado, Meta dijo que el lanzamiento de SAM estuvo acompañado por el lanzamiento de SA-1B (Segment Anything 1-Billio), el conjunto de datos de segmentación más grande hasta la fecha. Esta IA está entrenada para tener una “idea general” de lo que es un objeto y puede encontrar todo tipo de cosas en cualquier imagen o video.
¿Cual podría ser el uso principal de SAM?
La aplicación más obvia es la edición de fotos. Pero en el futuro, explicó Meta, los SAM podrían usarse para identificar objetos cotidianos a través de gafas de realidad aumentada. Los usuarios pueden recibir recordatorios o instrucciones de esta manera. La empresa también destacó sus aplicaciones potenciales en el análisis científico de imágenes.
El nuevo modelo de IA se entrenó en un conjunto de datos de más de mil millones de “máscaras de segmentación”, partes de un objeto que un sistema de visión artificial puede identificar por sus límites. Esto le permite generalizar a nuevos tipos de elementos, más allá de los que observa durante el entrenamiento. Meta también destaca que SAM le permite recopilar nuevas máscaras de forma interactiva en menos de 14 segundos.
Meta, la empresa matriz de Facebook e Instagram, ya utiliza una tecnología similar para tareas internas como categorizar imágenes, filtrar contenido inapropiado y recomendar publicaciones a los usuarios en su red social. Los modelos y conjuntos de datos SAM se pueden descargar para uso no comercial. Los usuarios que quieran probar el prototipo con sus propias imágenes también deben aceptar que es solo para fines de investigación.
El CEO Mark Zuckerberg explicó que, además de desarrollar SAM, Meta también hizo de la integración de más “herramientas creativas” de inteligencia artificial generativa en su aplicación un objetivo clave este año.
La compañía anunció su modelo de lenguaje propio, LLaMA, el pasado mes de febrero. A diferencia de ChatGPT o Bard, Meta describe su propuesta como una herramienta más “más pequeña y de mayor rendimiento”. También está disponible para grupos de investigación específicos bajo una licencia no comercial.
También te puede interesar: Motorola presenta el Edge 40 Pro con una pantalla de 165 Hz