Valores atípicos
Los valores atípicos pueden sesgar fuertemente sus modelos aprendidos si no los tiene en cuenta bien.
=> Los eventos que son los menos probables son a menudo los más memorables (como el momento en que dormiste la alarma, te pusiste accidentalmente una camisa manchada y calcetines mal combinados, saliste corriendo por la puerta a una tormenta eléctrica, no pudiste coger un taxi y terminaste deprimido en la cafetería del vecindario mientras tu frenemy más despreciado asistía a la audición que te perdiste y tomó el trabajo de tus sueños), viniendo a la mente más fácilmente que la monotonía de la rutina diaria. Estos recuerdos te hacen recordar un pasado y predecir un futuro que es más intenso, emocionalmente tenso y se caracteriza por eventos más inusuales de lo que realmente sucedió o sucederá. Dan Gilbert, profesor de psicología en Harvard, aborda este sesgo cognitivo en profundidad en el Capítulo 10 de Stumbling on Happiness , bien resumido con la idea de que “tendemos a recordar los mejores y los peores momentos en lugar de los más probables de veces “. Es importante entender que los recuerdos excepcionales son, por definición, no representativos.
- ¿Qué algoritmos son los mejores para el filtrado de spam? ¿Cómo deberían implementarse?
- ¿Qué es la discretización de características?
- ¿Es el modelo de análisis factorial una versión multivariada del modelo de mezcla gaussiana?
- ¿Cuáles son las tendencias recientes en ML e IA?
- ¿Por qué las redes neuronales recurrentes no pueden ampliarse bien?
Propiedad local de Markov
En una red bayesiana, cada variable es condicionalmente independiente de sus no descendientes dadas sus variables principales.
=> Tener más información no necesariamente te ayuda si ya tienes información que la subsume. Por ejemplo, si está evaluando el rendimiento laboral potencial de un candidato y sabe que ella es inteligente y trabaja duro por el conocimiento de primera mano, obtener su GPA y la transcripción no son particularmente útiles, ya que esas son meras señales de que ella es inteligente y trabaja duro. (Suponiendo que su modelo es que ser inteligente y trabajar duro son los únicos predictores del desempeño laboral, y que el GPA y la transcripción de alguien solo brindan información sobre su inteligencia y trabajo duro).
Dualidad / Equivalencia
Cuando la formulación original de un problema de optimización no cae en una forma estándar que se pueda resolver “fácilmente” (con los métodos de solución existentes), a menudo se puede transformar en una forma que sea solucionable, por ejemplo, moviendo restricciones a la función objetivo , sustituyendo variables, reemplazando restricciones de igualdad por restricciones de desigualdad, etc.
=> A menudo es posible resolver problemas aparentemente imposibles con solo pensar creativamente y abordarlos desde diferentes ángulos.
Busqueda local
Las técnicas de optimización que realizan búsquedas locales son susceptibles a los óptimos locales. Las formas de evitar esto incluyen el reinicio o las modificaciones estocásticas.
=> Si está buscando pero estableciéndose, a veces necesita cambiar su entorno o agregar algo de espontaneidad antes de encontrar a la persona / oportunidad / perspectiva de vida / algo deseado. Quizás hayas agotado las partidas de OkCupid por ti, y deberías probar amigos de amigos. Tal vez desee encontrar el éxito profesional y se esté desempeñando en la parte superior de su clase de analista de EII, pero no esté muy satisfecho, y debería explorar oportunidades en otras industrias. Tal vez estás atravesando una crisis existencial y tratando de entender tu vida y estás sobreviviendo pero no prosperando, y deberías leer algunos libros nuevos, conocer gente nueva, viajar a lugares nuevos, antes de descubrir tu propósito.
Maldición de dimensionalidad
Cuando los datos se vuelven demasiado dimensionales, es difícil trabajar con ellos y analizarlos. Sin embargo, las técnicas de reducción de dimensiones como el análisis de componentes principales o la selección de características pueden hacer que estos datos sean manejables.
=> Intentar trabajar con demasiada información a la vez es difícil. El trabajo del psicólogo de Princeton George Miller (y la investigación relacionada) ha demostrado que la persona promedio solo puede mantener un puñado de elementos en la memoria de trabajo en un momento dado, y el desempeño en tareas que requieren diferenciar más fragmentos de información cae drásticamente. Puede “engañar” un poco este límite agrupando o agrupando información en unidades más significativas; También puede intentar reducir su enfoque a unas pocas entradas clave e ignorar aquellas que tienen menos señal que ruido. El “Acto 1” de Your Brain at Work de David Rock es una buena referencia para una inmersión más profunda en el funcionamiento del cerebro humano y cómo lucha con la sobrecarga de información, y cómo puede usar su cerebro de manera más óptima.