Además de los algoritmos de aprendizaje automático similares a los que usa Netflix para predecir las futuras opciones de video de un usuario, YouTube verifica las pistas de audio y video de nuevas cargas en una enorme base de datos de medios con derechos de autor. Es un gran esfuerzo y se utilizan algunos algoritmos geniales para comparar tantos medios contra sí mismos.
Una vez agregué una canción de Mozart sobre una película casera y, a los pocos segundos de completar la carga, se me notificó que se eliminó automáticamente porque el audio infringía los derechos de autor de la música.
Todas las pistas de audio también pasan por el reconocimiento de voz a texto para la generación automática de subtítulos, con una opacidad de fuente diferente para indicar la confianza con la que se identificó cada palabra.
- ¿Hay alguna diferencia entre el modelado de temas y el clúster?
- ¿Cuándo recomendaría los modelos gráficos sobre el aprendizaje profundo?
- ¿Es posible darle a una computadora millones de imágenes de varios objetos, y se da cuenta de que hay cosas como animales, platos de cocina, montañas, etc. sin que nosotros lo digamos, y cómo se hace esto exactamente?
- ¿Cuáles son algunas buenas ideas de proyectos o ejemplos para un proyecto de curso de Visión de Computadora basado en Aprendizaje Automático?
- En la Bayes Net dada, ¿existe un caso de explicación del fenómeno?
Todo el audio y el video, según el número y la frecuencia de las vistas y la calidad inicial, se transcodifican en múltiples formatos de menor calidad. Esto requiere algoritmos de transcodificación eficientes, así como algoritmos de almacenamiento en caché para decidir qué videos se ven con la frecuencia suficiente para garantizar el almacenamiento y el tiempo de CPU necesarios para mantener múltiples copias de calidad variable.
Las transmisiones en vivo probablemente impliquen otra forma de transcodificación sobre la marcha.
Al igual que Facebook, estoy seguro de que YouTube utiliza algoritmos de visión artificial de aprendizaje automático para identificar y marcar material inapropiado, aunque de manera experimental que aún no afecta la experiencia del usuario (después de todo, todo en Google parece estar en beta perpetua) .
Debe haber docenas o cientos de otros agentes increíbles y procesos en segundo plano en ejecución que no he notado o considerado.