¿Cuál es la mejor manera de mostrar resultados para un trabajo de informática?

El formato que ha representado en el OP parece estar bien como punto de partida. Seguramente querrás hacer pruebas repetidas. Si realmente desea descifrar todos los matices posibles, sugeriría múltiples experimentos, donde el número de estados aleatorios varía cada vez, típicamente como múltiplos de diez (n1 = 10, n2 = 100, n3 = 1000, etc.). Para cada n #, repita el experimento diez veces y realice un seguimiento de todas estas pruebas utilizando el formato que ha representado, posiblemente incluso agregando columnas. Cuando tenga todos estos datos en bruto, puede usar el análisis estadístico (estándar dev, media, modo, etc.) para llegar a la raíz de lo que sea que esté tratando de encontrar / probar.

El método que describí es, quizás, excesivo para su proyecto. Es difícil decirlo sin ver los documentos de su proyecto, pero puedo decir con certeza que las pruebas repetidas, junto con el análisis estadístico de los datos agregados, es la mejor manera de eliminar las anomalías introducidas por cosas como el cambio de contexto del sistema operativo o la pila de procesos. Orden de operaciones. Sugiero hacer cosas en múltiplos de diez simplemente para facilitar el cálculo durante la fase de análisis (tiene el lujo de elegir este valor, entonces, ¿por qué no hacer que sea algo fácil para usted?).

Una tabla científica solo es realmente útil si compara diferentes tratamientos de un problema o un tratamiento de diferentes problemas. Entonces, por ejemplo, un análisis de búsqueda de amplitud puede tomar 21.7 movimientos en un 8 rompecabezas, 22.2 movimientos en un 9 rompecabezas, 22.7 movimientos en un 10 rompecabezas … espera, ¿es una tendencia lineal? ¿No deberíamos estar usando un gráfico entonces?

Por lo tanto, las tablas son realmente mejores para los datos categóricos (resultados para un problema de mosaico deslizante, un problema de vendedor ambulante, un problema de color del mapa; no hay una forma obvia de ordenarlos) que para los datos ordenados (¿ordinales?). Tendrás que descubrir qué es qué para tus resultados.

También debe determinar la cantidad de cifras significativas en su resultado, para lo cual necesita algún tipo de medida de incertidumbre. La desviación estándar es bien conocida, pero en realidad no es tan intuitiva; un intervalo de confianza del 95% (informe los percentiles 2.5 y 97.5) es lo que a veces doy. La incertidumbre determina las cifras significativas: no tiene sentido informar el tiempo al microsegundo (como lo hace actualmente) si sus incertidumbres son más o menos 0.1 ms.

No estoy seguro de lo que establecen las diferentes columnas de su tabla. ¿No debería un algoritmo que requiere menos movimientos también expandir menos nodos y tomar menos tiempo? Pero puede estar usando su tabla como una exportación exhaustiva de datos, en cuyo caso haga lo que necesite. Generalmente piense si las columnas de su tabla cuentan historias interesantes que dependen unas de otras, y si no lo hacen (tres columnas tienen la misma tendencia) piense cuidadosamente cuál comunica el punto más importante.

Finalmente, si sus pruebas son independientes, no importa si las procesa como un lote de diez mil o un lote de diez mil; sus datos aún tienen la misma media, incertidumbre y error de media estándar.

La forma en que debe mostrar los resultados depende de la hipótesis que está probando o del problema que está tratando de resolver. ¿Cuál es la motivación para esta investigación?

Cuando dice 1000 estados aleatorios 10 veces versus 10000 estados aleatorios una vez, ¿es diferente que en el primero informaría los movimientos promedio, los nodos promedio expandidos y el tiempo promedio para cada una de las 10 carreras? ¿Hay alguna razón por la cual la distribución de resultados sería diferente de una de las 10 carreras a otra?

La media y la desviación estándar son estadísticas resumidas, y ambas pueden ser interesantes. Más resultados le dan más para discutir, pero esa discusión debe ser relevante para el problema en cuestión. También podría usar un histograma para visualizar la distribución de los datos. Por ejemplo: ¿está seguro de que la distribución es unimodal? ¿Quizás la mayoría de las carreras rondan los 22 movimientos, pero también hay un grupo de carreras que terminan en menos de 10 movimientos?

Puede indicar dentro de su artículo el rango de datos recopilados (solo tiene que ser específico), dejar en claro que, en aras de no ser excesivamente redundante, ha tomado un tamaño de muestra específico de sus datos de su análisis BFS. Un trabajo de ciencias de la computación es como cualquier otro trabajo científico. ¡La mejor de las suertes!

More Interesting

¿Qué opinas sobre la computadora cuántica D-Wave 2?

¿Cuáles son algunos de los proyectos prácticos de informática?

¿Quiénes son algunos grandes científicos informáticos con una sólida formación en física?

¿Cuáles son los pasos para hacer captura de movimiento?

Cómo comenzar la investigación en informática teórica

¿Cuáles son las áreas famosas de Física que se cruzan con CS o Ingeniería de Software?

¿Cuáles son algunos de los buenos proyectos de investigación en informática de la escuela secundaria que puedo hacer?

En el problema del embalaje del contenedor (BPP), ¿por qué el primer ajuste decreciente (FFD) es más eficiente que el primer ajuste creciente (FFI)?

¿Un buen perfil en programación competitiva ayuda a obtener la admisión en los mejores programas de MS / Phd en las mejores universidades de EE. UU. Para Algoritmos / CS / Sistemas Teóricos? En caso afirmativo, ¿qué universidades específicas fomentan tales aplicaciones?

¿Por qué la comunidad de Computer Vision es hostil a las ideas simples?

¿Cuáles son los campos de investigación en informática que no requieren habilidades en codificación / programación?

¿Qué es el algoritmo de llenado de región en el capítulo de procesamiento morfológico?

¿Aprender Linux es importante para un estudiante de ciencias de la computación?

¿Quiénes son los mejores profesores que trabajan en Computación Cuántica?

¿Cuáles son las últimas ideas de investigación en informática?