Sobre redes neuronales - sin complicaciones innecesarias
En esta publicación, intentaremos explicar el fenómeno de las redes neuronales de forma accesible y evaluar la validez de las expectativas. Tanto entusiasta como apocalíptico.
La combinación de palabras "redes neuronales" enamoró a los periodistas. En términos de frecuencia de menciones en los medios, las redes neuronales solo son superadas por los emprendimientos de Elon Musk. Y compite con confianza con la inteligencia artificial y el calentamiento global.
No es de extrañar que las redes neuronales sean a la vez admiradas y temidas. Espere de ellos avances tecnológicos sin precedentes y consecuencias catastróficas de la aplicación.
Excursión a la anatomía
El mismo nombre de este fenómeno proviene de la biología. Las neuronas se denominan células especiales de organismos vivos que forman el sistema nervioso (las criaturas más primitivas con sistema nervioso son las medusas y los corales). Su tarea es recibir, transmitir y procesar información a través de impulsos eléctricos y reacciones químicas.
El mayor número de neuronas se encuentra en el cerebro. El número de neuronas en el cerebro humano se estima en alrededor de 100 mil millones. Es posible que haya muchos más, pero esos 100 mil millones los guardaremos en la memoria.
El siguiente punto importante para comprender el funcionamiento de las redes neuronales es la estructura de una neurona. Cada una de estas células consta de un cuerpo y procesos especiales: varias dendritas y un axón. Aquí tomamos nota de que las dendritas son los canales de ENTRADA de información, y el axón es la única SALIDA de información de la neurona.
Las neuronas tienen especialización. Algunos de ellos (receptor) reciben información procedente del exterior. En otras palabras, son sensores. Otros (efectores) transmiten una señal desde el sistema nervioso a las células circundantes. Finalmente, están las neuronas intermedias (intercalares).
En el cuerpo, miles de millones de neuronas están interconectadas. El tejido es increíblemente complejo. Entonces, según algunos datos, cada neurona contacta con 10 000 células vecinas (según otras fuentes, de 20 000). Finalmente, las sinapsis se ubican en los puntos de contacto de dos neuronas, formaciones especiales que pueden cambiar la señal que pasa a través de ellas.
Es decir, la información sobre el mundo exterior de los receptores pasa a través de un cierto número de neuronas intercaladas. De esta manera, de alguna manera cambia el paso de las sinapsis. Y solo al final llega a las neuronas efectoras. Esto es seguido por la reacción del cuerpo a la señal recibida.
Comenzando a copiar la naturaleza
Los primeros intentos de modelar las funciones elementales del sistema nervioso se realizaron a mediados del siglo XX. El primer modelo de una red neuronal biológica fue el perceptrón, un programa implementado en la computadora electrónica Mark-1 en los Estados Unidos en 1960.
El perceptrón repetía el trabajo de una sola neurona. Para ese nivel de programación y poder de cómputo, se logró un resultado realmente impresionante. La máquina aprendió a reconocer varias letras.
A pesar del éxito con la creación del perceptrón, pronto se desvaneció el interés por las redes neuronales. Lo cual es bastante comprensible. La tecnología informática no podía hacer frente al complejo aparato matemático utilizado en el modelado de redes neuronales.
El uso de semiconductores ha dado un nuevo impulso a la idea de las redes neuronales artificiales. El papel de las neuronas se asignó a los transistores. La miniaturización ha hecho posible empaquetar millones de transistores en microchips con un área de un par de centímetros cuadrados.
Y sin embargo, el número de transistores en la computadora más perfecta no alcanza todavía el número de neuronas en el cerebro de un ser vivo altamente desarrollado. Pero el obstáculo fundamental e insalvable (al menos en la actualidad) no es ni siquiera el número de componentes electrónicos. Recuerde que cada neurona interactúa con miles de células nerviosas. Un solo transistor, solo con unos pocos.
Sea como fuere, ya a principios de la década de 2000, el potencial de las computadoras hizo posible implementar ideas que antes no habían ido más allá de las teorías. Las redes neuronales han evolucionado de un fenómeno de TI curioso pero generalmente inútil a una poderosa herramienta para resolver muchos problemas.
Red neuronal artificial
La computadora hace un excelente trabajo al almacenar y reordenar incluso grandes cantidades de datos de acuerdo con instrucciones predeterminadas: programas. Sin embargo, tal enfoque no le permite, ni siquiera en principio, hacer lo que hace fácilmente el cerebro de incluso un animal no muy desarrollado. Por ejemplo, una computadora de este tipo no puede reconocer ciertos patrones y luego cambiar sus acciones.
En otras palabras, aprender. El concepto de redes neuronales artificiales supera esta barrera.
¿Cómo se entrena la red neuronal? Para empezar, una vez más hablaremos brevemente sobre su dispositivo.
Una red neuronal artificial consta de análogos de neuronas combinadas en capas. No tome el término "capa" literalmente. Físicamente, no existen capas de ningún chip. La palabra "capa" ayuda a comprender el esquema que explica el funcionamiento de la red neuronal. Al igual que el diagrama de cableado eléctrico en una casa no tiene nada que ver con la ubicación real de las lámparas, los enchufes y los cables que los conectan. Una capa es una colección de elementos que realizan una tarea específica. Y ocupando un lugar determinado en la tubería de procesamiento de información. La capa de entrada (análoga a las neuronas receptoras) transmite datos del mundo exterior a la red neuronal. La capa de salida (análoga a las neuronas efectoras) le dice al mundo exterior cómo reacciona la red neuronal a la información recibida.
Entre las capas de entrada y salida hay capas que procesan la información proveniente de la capa receptora. Se llaman ocultos. Todos los elementos de las capas ocultas están interconectados entre sí y con los elementos de la capa de salida.
Las redes neuronales en las que el número de capas ocultas es más de una se denominan profundas. Esta aclaración es importante para entender el término “aprendizaje profundo”.
Ahora déjame recordarte que en las redes neuronales biológicas hay zonas especiales en los puntos de contacto de las neuronas: las sinapsis. En tales zonas, la señal que pasa entre las neuronas cambia. El papel de las sinapsis en una red neuronal artificial lo realizan los llamados pesos. El peso puede ser positivo si una neurona excita a la otra y negativo si la suprime. Además, el peso no funciona como un simple interruptor. Al cambiar el peso, no solo puede activar / desactivar la conexión, sino también regular la fuerza de la influencia de un elemento de la red neuronal en los que lo rodean.
El siguiente componente importante de una red neuronal artificial es la retroalimentación entre la capa de salida y los pesos de las capas internas.
Cómo entrenar una red neuronal
El aprendizaje de una red neuronal se entiende como el proceso de ajustar los pesos de las relaciones entre elementos de capas ocultas.
Supongamos que tenemos alguna señal de referencia. Y queremos que la red neuronal produzca el mismo resultado.
Los datos arbitrarios se alimentan a la capa de entrada. Pasan a través de las capas internas, cambiando por medio de pesos en los enlaces entre los elementos de las capas internas. Habiendo ingresado a la capa de salida, dichos datos modificados se comparan con el estándar.
La retroalimentación envía un comando para cambiar los pesos. Hablando en sentido figurado, una persona señala una red neuronal: “Esto se hace mal. Vuelva a intentarlo". Los datos vuelven a pasar a través de la red neuronal y los valores de los pesos se cambian nuevamente a través de la retroalimentación. Tarde o temprano, la diferencia entre el valor de referencia y el valor producido por la red desaparecerá. La red neuronal pasar datos correspondientes al estándar a la capa de salida, ignorando el resto Es decir, aprenderá a reconocer un determinado conjunto de datos (esta frase se puede entender como un objeto, sonido, color, lo que sea).
Intentemos explicar con un ejemplo cómo se puede enseñar a una red neuronal a reconocer una taza.
La capa de entrada contiene varios elementos de entrada que describen algunos parámetros del objeto. Para una taza, estos pueden ser:
- un mango de cierta forma en su costado (de lo contrario, puede confundirse con una cacerola);
- proporciones (la altura es mayor que el ancho, a diferencia de un plato);
- tamaño (para distinguir una taza de una jarra);
- sección redonda.
Todas estas preguntas se pueden responder en el formato sí/no (uno/cero) y, al final, la imagen de la taza se puede crear como una combinación de ceros y unos.
Al "mostrar" una cantidad suficiente de tazas a la red neuronal, se puede asegurar que reconocerá el objeto independientemente del diseño. Ya sea una taza de oficina tosca, una elegante taza de té de porcelana de Meissen o un pequeño recipiente de espresso, la red neuronal lo reconoce. Y ahora puedes mostrarle a la red neuronal una jarra o una sartén. Será interesante saber: ¿cómo determinará lo que ve?
Redes neuronales en los negocios
Independientemente de cómo nos sintamos acerca de las redes neuronales artificiales, cada uno de nosotros las usa a diario para nuestros propios fines. Por ejemplo, al usar herramientas como la Búsqueda de Google o el Traductor de Google. Así es en los negocios. Quizás simplemente no nos damos cuenta de cuán extendidos están estos algoritmos informáticos en los negocios.
Así que aquí hay algunos números.
En 2020, el mercado mundial de redes neuronales se estimó en 14 350 millones de dólares. Según las previsiones, para 2030 alcanzará los 152.610 millones de dólares. tasa de crecimiento anual promedio - 26.7%.
América del Norte (más precisamente, los EE. UU.) sigue siendo el líder en el uso de redes neuronales en los negocios. Se supone que la región mantendrá su posición hasta 2030. Esto se explica por un inicio más temprano en el uso de redes neuronales y liderazgo tecnológico. Sin embargo, se espera que en la próxima década en la región de Asia-Pacífico, el uso de redes neuronales comience a crecer rápidamente. Incluyendo, debido al aumento constante en la cantidad de datos en Internet de las cosas (IoT).
Aunque la pandemia de COVID-19 causó una fuerte caída en este mercado en 2020, se espera que el espacio de las redes neuronales continúe su crecimiento nuevamente. Las empresas utilizan cada vez más el teletrabajo. Esto aumenta la demanda de soluciones en la nube, datos espaciales y herramientas para análisis y pronósticos de mercado. El crecimiento en el volumen de datos generados por diversas industrias, la necesidad de administrar y analizar estos arreglos se han convertido en factores clave en el crecimiento del mercado de redes neuronales.
La aplicación más rentable y exitosa de las redes neuronales resultó estar en el sector de la banca, los servicios financieros y los seguros.
Aquí, las redes neuronales se utilizan para predecir las tendencias del mercado, los precios de las acciones. En el negocio bancario, las redes neuronales se dedican a identificar desviaciones y anomalías en las transacciones para detectar fraudes. Las compañías de seguros utilizan esta herramienta para filtrar siniestros fraudulentos y circunstancias dudosas en casos de seguros, segmentando la clientela para obtener precios óptimos.
En marketing, las redes neuronales segmentan a los consumidores por modelo de consumo y situación económica. Las redes neuronales se han mostrado bien a la hora de hacer recomendaciones para productos de consumo.
Sin embargo, el uso de redes neuronales tiene sus inconvenientes. Una de las principales quejas al intentar usar redes neuronales en los negocios es que necesitan mucho tiempo de entrenamiento usando una gran cantidad de datos de alta calidad.
Otro problema es la falta de especialistas capacitados que trabajen con redes neuronales y la falta de comprensión por parte de la alta dirección de las empresas de las tareas que pueden resolver las redes neuronales. Muy a menudo, esto genera grandes expectativas y la posterior decepción con la implementación de las redes neuronales.
Límites de posibilidades
Empecé hablando de las redes neuronales con su popularidad en los medios. Las personas que no están demasiado dedicadas al tema admiran las perspectivas que se abren y expresan miedo y aprensión por el uso generalizado de las redes neuronales. En primer lugar, se sospecha que las redes neuronales tienen la posibilidad de obtener inteligencia.
Por eso es importante ser consciente de los límites y limitaciones para el uso de redes neuronales.
Comencemos con el hecho de que la analogía entre redes neuronales biológicas y artificiales es la más general. Aunque solo sea porque una persona hasta el día de hoy no sabe completamente por qué principios funciona el cerebro. Ninguna red neuronal artificial puede igualar la complejidad de su organización con el cerebro de un mamífero primitivo.
Por otro lado, una red neuronal, incluso la más sofisticada, no difiere fundamentalmente de muchos algoritmos informáticos utilizados por la humanidad. Las nuevas posibilidades de las computadoras dan más oportunidades para la aplicación de estos algoritmos. Pero aún así, estos son éxitos cuantitativos, no cualitativos. A principios de los 90, las computadoras i386 usaban el editor de texto Multi-Edit, y hoy existen las últimas versiones de Word con capacidades incomparables en comparación con Multi-Edit. Pero fundamentalmente es solo una herramienta de procesamiento de textos. De manera similar, las redes neuronales, sin importar cuán poderosas sean, siempre están diseñadas para realizar una tarea específica.
Érase una vez, muchos quedaron impresionados por la victoria del programa Alpha Go sobre los maestros del juego Go. Al mismo tiempo, muchos perdieron de vista el hecho de que, a diferencia de una persona viva, el programa no puede hacer nada más que jugar. Es decir, es una herramienta muy compleja, extremadamente costosa, pero altamente especializada. No hay necesidad de hablar de ninguna inteligencia artificial en esta historia.
Los escépticos generalmente prestan atención al hecho de que el límite de posibilidades para las redes neuronales es lo que hace que una parte del cerebro como el cerebelo, que es responsable de las reacciones automáticas. La conciencia y la razón están conectadas con partes completamente diferentes del cerebro.
Ahora sobre la capacidad de autoaprendizaje. Definamos el autoaprendizaje de manera diferente: reiniciar repetidamente el algoritmo con un cambio constante en los datos de entrada.
Y eso es todo. Todo patetismo desaparece. Nada como el aprendizaje humano. Lo máximo que se me ocurre es el desarrollo de algunas habilidades simples para el automatismo.
Además, sin la influencia externa de alguien dotado de pensamiento abstracto, la red neuronal no aprenderá nada. En la parte del universo más cercana a nosotros, el hombre sigue siendo dueño del pensamiento abstracto. Los extraterrestres aún no han aparecido. Por lo tanto, sin la influencia humana, las redes neuronales simplemente no son capaces de funcionar y desarrollarse.
Por lo tanto, uno no debe tener miedo de que un día las redes neuronales piensen en la vida y sus relaciones con las personas. Siempre serán nada más que una herramienta para la solución de los problemas que les asigne el hombre.
¿Se esfuerza por llevar su negocio al siguiente nivel, lograr sus objetivos de manera más rápida y eficiente? Apix-Drive es su asistente confiable para estas tareas. Un conector de aplicaciones y servicios en línea lo ayudará a automatizar procesos comerciales clave y deshacerse de la rutina. Usted y sus empleados liberarán tiempo para tareas centrales importantes. Pruebe las funciones de Apix-Drive de forma gratuita para comprobar por sí mismo la eficacia del conector en línea.