Preguntar cómo podríamos controlar una superinteligencia divina para que siga siendo amigable, es como las bacterias en el intestino preguntando cómo podrían evolucionar hacia el tipo de humanos que no usarán antibióticos. Nuestros cerebros no son lo suficientemente potentes como para comprender el problema, mucho menos resolverlo.
El modelo de amenaza de “IA amigable” planteado por MIRI y el Instituto del Futuro de la Humanidad es que una IA poderosa y recursiva que se mejora automáticamente podría malinterpretar o cambiar los objetivos que le damos. Como un simple ejemplo, una IA podría malinterpretar “eliminar todo el sufrimiento humano” al matar a todos los humanos. Incluso si somos muy cuidadosos con lo que pedimos, y diseñamos la IA para comprender lo que queremos decir, sus objetivos aún podrían derivar en una dirección egoísta a medida que la IA crea versiones más inteligentes de sí misma. ¿Cómo nos aseguramos de que cuando los robots construyan robots más inteligentes, los robots hijos tengan los mismos objetivos? ¿Cómo podemos saber cuáles son sus objetivos cuando es más inteligente que nosotros?
No estoy de acuerdo con dos aspectos del modelo de amenaza MIRI / FHI. Primero, la IA generalmente no es un proceso de optimización dirigido a un objetivo. El aprendizaje de refuerzo es una forma ineficiente de transferir conocimiento a una computadora porque la señal de recompensa / penalización tiene un ancho de banda bajo. Además, Shane Legg demostró (ver ¿Existe una teoría universal elegante de la predicción?) Que los estudiantes poderosos son necesariamente complejos. No existe un algoritmo de aprendizaje de propósito general que pueda satisfacer objetivos arbitrarios. El efecto práctico de este teorema es que incluso cuando el objetivo es obvio, como para Deep Blue (ganar en el ajedrez) o Watson (¡ganar en Jeopardy! ), Todavía terminamos escribiendo mucho código para resolver un problema muy específico. Ciertamente, el sistema no vivo más inteligente del planeta, Internet, no se puede describir útilmente como teniendo objetivos.
- ¿Cuáles son las principales áreas de investigación en el campo de los superconductores actualmente?
- ¿Cuáles son algunas de las áreas de investigación más interesantes sobre cómo la teoría de gráficos / redes se aplica a campos no tecnológicos como la biología, las finanzas o la sociología?
- En el campo de la visión por computadora, ¿a qué se refiere el término 'segmentación'?
- ¿Cuáles son los documentos más influyentes en el mundo del big data? ¿Por qué?
- ¿Qué investigación de vanguardia se está haciendo en el dominio de los sistemas operativos?
En segundo lugar, la inteligencia depende tanto del conocimiento como de la potencia informática. Pero una IA que hace una copia de sí misma no puede enseñarle a la copia nada que ya no sepa. Solo puede agregar velocidad de computación y memoria.
Creo que los autorreplicadores son, sin embargo, una amenaza. Vale la pena preguntar qué tan rápido un robot autorreplicante podría dominar el mundo y desplazar la vida basada en el ADN. Según Robert Freitas, unas pocas semanas. (Ver algunos límites a la ecofagia global). Los autorreplicadores más rápidos tendrían aproximadamente el mismo tamaño, velocidad y requisitos de energía que las bacterias, dentro de un orden de magnitud. Copiar bits, ya sea en ADN o en silicio, requiere energía k T ln 2 por bit, donde T es la temperatura yk es la constante de Boltzmann. Los organismos vivos ya han evolucionado cerca de este límite. Sin embargo, podemos hacer mejoras marginales. Por ejemplo, ya tenemos células solares que convierten del 20% al 30% de la luz solar en energía utilizable, en comparación con el 8% para la fotosíntesis.
Espero que las impresoras moleculares tridimensionales se vuelvan tan baratas como las computadoras. Cuando eso suceda, cualquiera podrá crear patógenos genéticamente modificados o nanobots autorreplicantes tan fácilmente como puede crear virus informáticos en la actualidad. Nuestra trayectoria en el manejo de agentes autorreplicantes es deficiente, ya sea malware o malaria portadora de mosquitos.