27/09 15:40HS @ Gran SalaTRACK DATA SCIENCE / AI
WebGPU-Accelerated AI: LLMs in Your Browser
Speaker: Juan Oliú
En esta presentación, descubrirás cómo ejecutar modelos de lenguaje (LLMs) directamente en el navegador. Analizaremos cómo el uso de WebGPU puede permitir ejecutar aplicaciones de inteligencia artificial en tiempo real desde el navegador. Durante la sesión, profundizaremos en la configuración técnica y la ejecución de LLMs dentro del navegador, mostrando cómo instalar, crear y gestionar instancias del MLCEngine, y cómo interactuar con estos modelos para generar respuestas de manera dinámica, tanto en formatos estáticos como en tiempo real. Hablaremos de los beneficios clave de ejecutar LLMs directamente en el navegador, como mejoras en la privacidad y transparencia, así como de los desafíos, incluyendo las demandas de recursos. A través de demostraciones en vivo, verás aplicaciones prácticas en acción, junto con comparativas de rendimiento entre soluciones que corren en el navegador y aquellas que dependen del servidor. También proporcionaremos una visión crítica de las fortalezas y limitaciones de los LLMs basados en navegador. Además, discutiremos el futuro de Web LLM, explorando integraciones con tecnologías emergentes como WebAssembly, y cómo los desarrolladores pueden contribuir al avance de este emocionante campo. Ya seas desarrollador, investigador, o simplemente un entusiasta de la IA, te llevarás conocimientos prácticos para implementar potentes LLMs en tus propios proyectos web