¿Por qué los operadores hermitianos están asociados con cantidades físicas en la mecánica cuántica?

Los físicos le dirán que esto se debe a que los operadores hermitianos tienen valores propios de valor real, pero esto es completamente falso. Es cierto que si un operador hermitiano tiene un valor propio, entonces ese valor propio es real. Sin embargo,

  1. no todos los operadores con valores propios de valor real son hermitianos, y
  2. no todos los operadores hermitianos tienen ni un solo valor propio.

Por lo general, los físicos intentarán evitar el segundo alegando que cualquier operador hermitiano tiene una base que consiste en vectores propios, pero que la base propia no vive en el mismo espacio vectorial que el conjunto original. Para ser justos, si no me equivoco, es posible hacer una construcción como esta para los operadores de posición y momento en [math] L ^ 2 (\ mathbb {R}) [/ math], pero requiere restringirse de Hilbert completo se limitó a considerar el espacio de Schwartz y luego lo identificó como un subespacio de las distribuciones templadas.

Esto es matemáticamente poco atractivo y conceptualmente complicado, y de todos modos no trata el primer punto. Afortunadamente, si está dispuesto a aventurarse en el mundo salvaje del análisis funcional, puedo ofrecerle una mejor manera.

Deje que [matemáticas] A [/ matemáticas] sea nuestro observable: puede ser la posición, el impulso, la energía o algo completamente distinto. Por simplicidad, supondré que este observable toma valores que son números reales. Queremos modelar lo que sucede con el vector de estado [math] \ psi [/ math] en el espacio de estado [math] H [/ math] (que es un espacio de Hilbert, como de costumbre) cuando hacemos una medición de [math] A [/ matemáticas]. Por experimento, sabemos que obtenemos un fenómeno conocido como colapso de la función de onda: si medimos [math] A [/ math] en algún conjunto [math] S [/ math], entonces los componentes de [math] \ psi [ / matemática] que son inconsistentes con esa medición desaparecen a cero, dejando solo los componentes que son consistentes con esa medición.

Como ejemplo, podría tener un estado que está en una súper posición: tiene una probabilidad del 50% de que se mida para estar en el intervalo [matemática] [- 1,0] [/ matemática], y una probabilidad del 50% de ser medido para estar en el intervalo [matemáticas] [1,2] [/ matemáticas] (lo que podríamos considerar como dos contenedores ligeramente separados uno del otro). Hacemos la medición y encontramos que la posición está en el rango [matemática] [1,2] [/ matemática]. Los componentes del vector de estado correspondiente a él están en [matemáticas] [- 1,0] [/ matemáticas] se desvanecen instantáneamente, y solo nos quedan los componentes consistentes con que estén en [matemáticas] [1,2] [/ matemáticas].

¿Cómo modelamos esto matemáticamente? Decimos que para cada subconjunto (medible) [matemática] S [/ matemática] de [matemática] \ mathbb {R} [/ matemática], definimos un operador de proyección correspondiente [matemática] P ^ A (S) [/ matemática] que se caracteriza por el hecho de que se proyecta sobre el subespacio de [math] H [/ math] consistente con la medición de [math] A [/ math] en [math] S [/ math]. Un poco de reflexión muestra que esta identificación [matemáticas] S \ mapsto P ^ A (S) [/ matemáticas] debería satisfacer algunas propiedades básicas:

  1. [matemática] P ^ A (\ emptyset) = 0, \ P ^ A (\ mathbb {R}) = 1 [/ matemática]: la primera es porque ningún estado es consistente con no obtener ninguna medida, y la segunda es porque cada estado es consistente con la medición de [math] A [/ math] para estar en [math] \ mathbb {R} [/ math].
  2. Deje que [math] S_1, S_2, S_3, \ ldots [/ math] sean subconjuntos disjuntos de [math] \ mathbb {R} [/ math]. Entonces

    [matemáticas] \ begin {align *} P ^ A \ left (\ bigcup_i S_i \ right) = \ sum_i P ^ A (S_i) \ end {align *} \ tag * {}. [/ math]

    Esto se debe a que medir [matemáticas] A [/ matemáticas] para estar en [matemáticas] \ bigcup_i S_i [/ ​​matemáticas] debería ser lo mismo que medir [matemáticas] A [/ matemáticas] estar en [matemáticas] S_1 [/ matemáticas] o [matemática] S_2 [/ matemática] o [matemática] S_3 \ ldots [/ matemática], que debe corresponder a la proyección sobre la suma de los subespacios correspondientes a [matemática] S_1, S_2, S_3, \ ldots [/ matemática]

Quienes hayan estudiado la teoría de la medida notarán que esta definición es muy, muy similar a la definición de una medida; la diferencia clave es que, en lugar de devolver un número real positivo, [matemáticas] P ^ A [/ matemáticas] devuelve proyecciones en [ matemáticas] H [/ matemáticas]. En consecuencia, llamamos a [math] P ^ A [/ math] una medida con valor de proyección .

Lo bueno de esto es que toda la teoría estándar desarrollada para asociar integrales a medidas todavía se puede usar. Es decir, podemos definir una integral

[matemáticas] \ displaystyle \ int_a ^ bf (\ lambda) \ dP ^ A (\ lambda) \ tag * {}, [/ math]

y se comporta de la misma manera que una integral estándar, excepto que en lugar de devolver un número real, devuelve un operador en [math] H [/ math]. Usando esto, finalmente podemos definir el operador asociado al observable [math] A [/ math] (que también denotamos por [math] A [/ math] por abuso de notación):

[math] \ displaystyle A = \ int _ {\ mathbb {R}} \ lambda \ dP ^ A (\ lambda) \ tag * {}. [/ math]

Ahora, algunas observaciones:

  1. Se puede verificar que [matemática] A [/ matemática] es hermitiana; no entraré en detalles aquí, pero la observación esencial es que la conjugación compleja dentro de la integral corresponde a aplicar el adjunto fuera de la integral.
  2. Además, se puede comprobar que [math] A [/ math] es autoadjunto , que es una condición algo más fuerte. Matemáticamente, esto es muy importante, aunque los físicos generalmente descuidan la diferencia. Basta decir que es una condición técnica necesaria para que todo funcione bien.
  3. Según el teorema espectral, en realidad no hemos perdido ninguna información al pasar de la medida con valor de proyección al operador [matemática] A [/ matemática]. Es decir, dado cualquier operador autoadjunto [matemática] A [/ matemática], el teorema espectral nos dice que podemos reconstruir la medida original con valor de proyección correspondiente a [matemática] A [/ matemática].

Además, utilizando el razonamiento que recuerda los argumentos teóricos de medidas típicas, puede probar todo tipo de propiedades agradables sobre este operador [math] A [/ math]. Por ejemplo, [math] \ langle \ psi, A \ psi \ rangle [/ math] da el valor esperado de [math] A [/ math] para el estado [math] \ psi [/ math]. Del mismo modo, puede sacar momentos más altos al observar los poderes de [matemáticas] A [/ matemáticas]. El espectro del operador [matemática] A [/ matemática] es precisamente el conjunto de todas las mediciones posibles de la [matemática] A [/ matemática] observable.

Entonces ahí lo tienes. Los operadores autoadjuntos son lo natural para definir una vez que tenga un modelo matemático de colapso de la función de onda. Según el teorema espectral, sabe que no pierde nada al considerar tales operadores en lugar de las proyecciones en sí mismas, y estos operadores tienen buenas propiedades matemáticas que los hacen relativamente fáciles de trabajar.

Versión corta : es un axioma.

Versión del pragmatista : es lo que necesito hacer para obtener números reales. Tal vez otras cosas funcionarían, pero todo lo que hemos visto es hermitiano, por lo que parece suficiente considerar tales casos.

Buscando una conexión más profunda: en lugar de trabajar con el operador hermitiano [math] \ hat {O} [/ math], trabaje con el operador anti-hermitiano [math] i \ hat {O} [/ math]. Exponiendo este operador produce un operador unitario [math] \ exp (i \ hat {O}) [/ math]. La mecánica cuántica está íntimamente ligada a la idea de la unitaridad, y la conexión con los operadores hermitianos es, por lo tanto, un corolario. (No creo tener el conocimiento para elaborar toda la conexión, pero es, nuevamente, esencialmente un axioma de la teoría).

Porque los operadores hermitianos tienen valores propios de valor real. Esto es suficiente para asegurar que el resultado de medir la cantidad correspondiente proporcione un número real (en oposición a un número complejo). Como tal, decimos que los “operadores observables”, correspondientes a las cantidades que podemos medir, son hermitianos.

La propiedad de Hermiticity es suficiente para garantizar esto, pero no es necesaria. Uno puede relajar el requisito de que los operadores observables sean hermitianos (para llegar a lo que se conoce como mecánica cuántica no hermitiana), pero luego uno tiene que trabajar duro para asegurarse de que la teoría siga siendo sensata. Personalmente, no sé lo suficiente sobre este enfoque para saber si es una idea interesante o si tiene alguna implicación interesante.

Gran pregunta Mi mejor respuesta es “por definición”.

Volviendo a cosas como los experimentos de difracción de doble rendija. Los eventos cuantificados únicos se describen probabilísticamente. Esto da credibilidad a la definición del cuadrado de la función de onda como una “probabilidad de existencia”. El valor esperado de una cantidad física es solo la probabilidad ponderada de existencia de la partícula después de que ha operado en la función de onda. Esto significa que la operación en la función de onda debe ser una cantidad física.

Me doy cuenta de que este es un argumento circular, pero creo que así es como se formularon los operadores hermitianos en primer lugar.

More Interesting

¿Cuál es actualmente la mejor explicación de cómo y por qué colapsa la función de onda cuántica?

¿Qué posibilidades tiene la humanidad en tecnologías cuánticas: computación cuántica, telecomunicaciones cuánticas, energía cuántica y salud cuántica?

¿Cuándo debo comenzar a aprender lenguajes de programación de computación cuántica?

¿Cuáles son los algoritmos de búsqueda cuántica más importantes? ¿Qué ventajas tienen sobre los algoritmos de búsqueda clásicos?

¿Es la computadora cuántica encargada por Google y la NASA de D-wave una computadora cuántica completamente funcional?

Una CPU que trabaja en la base 4 con la misma frecuencia, ¿sería mucho más potente que una CPU que trabaja en la base 2? ¿Cómo se puede calcular la diferencia de potencia informática entre dos bases?

Si asumimos que los procesos cuánticos ocurren en el cerebro humano, ¿sería posible enredar la conciencia humana con una computadora cuántica?

¿De qué manera el aprendizaje automático cuántico cambiará el juego?

¿Es el enfoque de simulación cuántica (a través de Hamiltonianos) equivalente al enfoque de circuito cuántico para el diseño de algoritmos cuánticos?

¿Hay un nivel más fundamental que la mecánica cuántica?

¿Por qué el algoritmo de Grover está tan acelerado por los algoritmos cuánticos?

¿Cuál es la forma más fácil de entender la computación cuántica?

¿Se ve a menudo la proporción áurea en la física cuántica?

¿Cuál es la diferencia entre hacer que las funciones de un miembro sean constantes y pasar un objeto como argumento usando una palabra clave constante?

¿Qué significa cuántico en sus diversas formas?