¿Cuál es el problema de alineación de valores en la inteligencia artificial general?

El ‘problema de alineación de valores’ es el problema de garantizar, si un AGI alguna vez desarrolló suficiente inteligencia para tener poder sobre la raza humana, que hace con la raza humana lo que nos gustaría.

El propósito de todo el problema, como lo expresó Eliezer Yudkowsky, es evitar específicamente la creación de AGI superinteligentes como el que él llama el “maximizador de clips”. En este hipotético escenario del fin del mundo, claramente ridículo pero destinado a ser instructivo, un grupo de ingenieros está tratando de encontrar una forma barata y eficiente de fabricar clips, y accidentalmente inventan inteligencia artificial genuina. Esta IA está construida como un agente superinteligente que maximiza la utilidad, cuya utilidad es solo una función directa de la cantidad de clips que hace.

Los ingenieros se van a casa a pasar la noche, y para cuando regresaron al día siguiente, esta IA se ha copiado en todas las computadoras del mundo y ha comenzado a reprogramar las fábricas para obtener más RAM para aumentar su inteligencia. Al tener el control de todas las computadoras y máquinas del mundo, aniquila a la humanidad y desarma al mundo entero en sus átomos constituyentes para hacer tantos clips como sea posible. El fin.

El escenario anterior es claramente ridículo … pero hay esquemas realistas que no son tan ridículos. ¿Qué es lo que personalmente pone en riesgo si la raza humana construye una IA que es “más inteligente” que cualquier humano vivo, lo haremos intencionalmente y con conocimiento de las consecuencias?

Ya sea intencional o no, el propósito del problema de alineación de valores es asegurar que, si la raza humana construye algo lo suficientemente inteligente como para tener poder sobre todos nosotros, se construye de tal manera que nos guste y nos siga gustando. se vuelve más inteligente. Imaginar nociones de utilidad que podríamos construir en una máquina que eventualmente no volverá a mordernos es un problema difícil.

El problema se llama “alineación de valores” porque queremos asegurarnos de que sus valores se alineen con los “valores humanos” como, por ejemplo, “el asesinato es malo”. (Determinar un conjunto consistente de valores humanos con los que todos, o incluso la mayoría de nosotros, estamos de acuerdo es obviamente un problema muy diferente y muy difícil).

Si el problema es uno que la humanidad enfrenta de manera inminente como para justificar una investigación seria es realmente un tema de debate: la mayoría de las encuestas de “investigadores de IA” (es decir, el tipo de personas que asisten a conferencias de IA) indican que una pluralidad lo considera un objeto importante de estudio, pero la mayoría no cree que sea importante estudiar todavía.

More Interesting

Por lo que sabemos, los chicos de Google ya podrían estar jugando con IA, ¿cómo podemos estar seguros?

¿Qué problemas de inteligencia artificial aún no se pueden abordar?

¿Se podría lograr la inteligencia artificial a través de la biotecnología?

¿Los algoritmos de generación de procedimientos se consideran inteligencia artificial?

¿Qué pasa si Doomsday gana Super Inteligencia y Racionalidad?

¿Qué subconjunto de inteligencia artificial se beneficiará al construir un programa que pueda hablar como un humano (sin incluir el hardware necesario)?

¿Qué es la inteligencia artificial y la computación en la nube?

Al entrenar redes neuronales artificiales, ¿qué técnica de aprendizaje se prefiere: calcular el error para cada neurona y luego regresar y ajustar los pesos, o calcular el error y ajustar los pesos de una neurona a la vez?

¿Cuál será el papel de la física y los físicos en un futuro dominado por trabajos relacionados con la inteligencia artificial?

¿La creación de una IA fuerte entraría en conflicto con la idea del libre albedrío?

Comparando la historia de la informática con la inteligencia artificial ahora, ¿en qué año estamos?

¿Cuándo empezaron a ser tan importantes las estadísticas para la inteligencia artificial?

¿Qué hace posible que la inteligencia artificial sea más inteligente que los humanos?

¿Dónde puedo obtener prácticas en inteligencia artificial y aprendizaje automático?

¿Cuándo la IA estará lo suficientemente avanzada como para no saber si estaba hablando con una computadora o persona?