¿Es mejor tener demasiados falsos positivos o demasiados falsos negativos?

Es dependiente de la aplicación.

Supongamos que tiene un modelo que realiza el diagnóstico de la enfermedad: ¿un paciente determinado tiene la enfermedad X o no? Es mejor tener falsos positivos aquí. Está bien afirmar falsamente que un paciente tiene una enfermedad y luego darse cuenta de que la decisión fue incorrecta, tal vez después de más pruebas / algunos medicamentos preliminares. Sin embargo, un falso negativo aquí significa que alguien que tenía una enfermedad no recibió el tratamiento médico adecuado, lo que podría ser fatal.

Por otro lado, considere un modelo que resume los currículums para una entrevista de trabajo en una empresa. Suponiendo que obtenga candidatos más prometedores que el número de puestos que desea llenar, un falso negativo equivale a rechazar a un buen candidato, lo cual no es un gran problema, dado que obtendrá otros candidatos similares. Sin embargo, un falso positivo significa que preseleccionas a alguien que no es lo suficientemente bueno, lo que desperdiciará los recursos de la compañía en el proceso de la entrevista.

More Interesting

¿Qué se considerará más respetable, un puesto de ingeniería de ciencia de datos en IBM Watson o Google?

¿Cómo es útil el Big Data para desarrolladores y administradores?

¿Es necesario obtener una maestría para trabajar en el área de ciencia de datos, si no tengo experiencia previa? ¿Los reclutadores valoran alguna certificación en ciencia de datos o buscan principalmente una maestría?

¿Cómo debo planificar cuando aspiro a ser un científico de datos?

¿La ciencia de datos y la IA están relacionadas de alguna manera?

Como uno de los primeros practicantes de inteligencia artificial y reconocimiento de voz, ¿qué piensa James Baker del rumor en torno al aprendizaje automático y la ciencia de datos en la década de 2010?

¿Los desarrolladores de iOS y Android tienen más demanda debido a Data Science?

¿Qué universidades de EE. UU. Son buenas y tienen un curso de maestría en big data o análisis de datos?

¿Qué habilidades se necesitan para los trabajos de aprendizaje automático?

¿Cuál es la forma más rápida de realizar un EDA en un conjunto de datos con más de 100 variables?

¿Habrá escasez de especialistas en aprendizaje automático?

¿Qué es Big Data y por qué la gente lo aprende?

¿En qué trabaja la oficina de Palantir en París? ¿Trabajan en el aprendizaje automático o en la minería de datos?

Si quiero desarrollar herramientas analíticas en tiempo real para mi sitio web y agregar recomendaciones basadas en objetivos en tiempo real, ¿cuál entre PredictionIO y EasyRec sería una mejor opción? ¿Hay otras opciones mejores (de código abierto) disponibles aparte de estas dos?

¿Hacer Zipfian (para ciencia de datos) o Iron Yard (diseño web) sinergizaría mejor con mis habilidades de ingeniería front-end?