El aprendizaje automático se está volviendo omnipresente, gracias a los avances recientes y los nuevos lanzamientos. Con la creciente popularidad de la IA y el aprendizaje automático y la demanda de modelos de aprendizaje automático a nivel de producción, es muy importante detectar problemas de aprendizaje automático y formular una solución para ellos. Los patrones de diseño son la mejor manera de reducir la solución a un problema de aprendizaje automático. La idea de un patrón ayuda a definir un problema y generar una solución profunda a ese problema que se puede reutilizar para resolver problemas similares cualquier cantidad de veces.
Los patrones de diseño codifican el conocimiento en instrucciones que pueden seguir los profesionales de todo el mundo. Se utilizan diferentes patrones de diseño de ML en diferentes etapas del ciclo de vida de ML. Algunos se utilizan para enmarcar problemas, evaluar la viabilidad o abordar la fase de desarrollo o implementación de un modelo de ML. Recientemente, un usuario de Twitter llamado Eugene Yan discutió patrones de diseño en sistemas de aprendizaje automático en su hilo. Ha incluido algunos de ellos en su tweet.
- Cascade: Cascade implica dividir un problema complejo en problemas más simples y luego usar modelos posteriores para abordar problemas más difíciles o específicos. El ejemplo compartido es sobre Stack Exchange, una plataforma comunitaria en línea, sobre cómo utilizan una serie de defensas contra el spam. Consta de múltiples capas de protección para detectar y evitar que el spam se propague en su plataforma, y cada capa se enfoca en un aspecto diferente de la detección de spam. La primera línea de defensa es cuando alguien publica demasiado rápido para ser humanamente posible (HTTP Error 429), la segunda es si alguien es atrapado a través de expresiones regulares y reglas (Heurística), y la tercera es muy precisa según las pruebas de sombra (ML). Cascade funciona de manera sistemática y jerárquica y, por lo tanto, es un enfoque eficaz. Consulte los recursos aquí.
- Reformulación: la reformulación implica redefinir el problema original para que sea más fácil de resolver. El ejemplo en el tweet es sobre Alibaba, una gran plataforma de comercio electrónico que ha reelaborado el modelo de recomendación en cadena, lo que ayuda a predecir el próximo elemento con el que es probable que interactúe un usuario. Consulte los recursos aquí.
- Human in the Loop: esto implica recopilar etiquetas o anotaciones de usuarios, servicios de anotación o expertos en dominios para mejorar el rendimiento del modelo ML. Los ejemplos mencionados en el tweet son Stack Exchange y LinkedIn, donde los usuarios pueden denunciar publicaciones no deseadas. Esto permite a los usuarios proporcionar comentarios sobre el contenido de spam, que se puede usar para entrenar modelos ML para detectar mejor el spam en el futuro y filtrar mensajes ofensivos. CConsulte los recursos aquí.
- Aumento de datos: implica la creación de variaciones sintéticas de los datos de entrenamiento para aumentar el volumen y la versatilidad para mejorar la generalización de los modelos ML y reducir el riesgo de sobreajuste. Se proporciona un ejemplo en DoorDash, una plataforma de entrega de alimentos, donde el aumento de datos se utiliza para abordar el desafío de categorizar y etiquetar con precisión nuevos elementos de menú que tienen datos limitados o no disponibles para entrenar un modelo. Consulte los recursos aquí.
- Volante de datos: es un ciclo de retroalimentación positiva donde más datos recopilados mejoran los modelos de ML, lo que da como resultado más usuarios y datos. El ejemplo de Tesla se compartió mientras recopila datos de sus automóviles, como datos de sensores, métricas de rendimiento y patrones de uso. Estos datos se utilizan para identificar y clasificar errores que ayudan a mejorar los modelos utilizados para tareas como la conducción autónoma. Consulte los recursos aquí.
- Reglas comerciales: implica agregar alguna lógica o restricciones adicionales para aumentar o ajustar la salida de los modelos ML según el conocimiento del dominio o los requisitos comerciales. Twitter usa modelos ML para predecir el compromiso, que organiza la aparición de tweets en líneas de tiempo. Los pesos o reglas establecidos manualmente también se utilizan como restricciones en la salida de los modelos ML para incorporar conocimiento en el proceso de toma de decisiones. Consulte los recursos aquí.
Por lo tanto, los patrones de diseño en los sistemas de aprendizaje automático pueden mejorar el rendimiento, la confiabilidad y la interpretabilidad de los modelos y ayudar a resolver los desafíos en el campo.
Este artículo fue inspirado por este tuit No olvides unirte Sub Reddit de 19k+MLY canal de discordiaY Y Boletín electrónico, donde compartimos las últimas noticias de investigación de IA, interesantes proyectos de IA y más. Si tiene alguna pregunta sobre el artículo anterior o si nos hemos perdido algo, no dude en enviarnos un correo electrónico a [email protected]
🚀 Echa un vistazo a las herramientas de IA de 100 en el club de herramientas de IA
Tania Malhotra está en el último año de la Universidad de Estudios de Petróleo y Energía, Dehradun, cursando un BTech en Ingeniería Informática con especialización en Inteligencia Artificial y Aprendizaje Automático.
Le apasiona la ciencia de datos y tiene un buen pensamiento analítico y crítico, además de un gran interés en adquirir nuevas habilidades, liderar grupos y administrar el trabajo de manera organizada.
“Orgulloso adicto al café. Gamer. Introvertido incondicional. Pionero de las redes sociales”.