Excelentes respuestas hasta ahora. Tengo algunos puntos de vista:
- Costo: con interconexiones especializadas (no una necesidad absoluta) y naturaleza especializada, un sistema de computadora en clúster normalmente costaría más
- Las computadoras de clúster son de hecho más especializadas y tienen un acoplamiento más estricto en términos del bus. Dicho esto, ¡una vez tuve un clúster de Hadoop con infiniband!
- Sistema distribuido, esencialmente significa que uno puede aprovechar el poder colectivo de muchas computadoras, conectadas libremente a través de una pila de software (como hadoop o TensorFlow) para realizar muchas formas de tareas de computación paralelas (paralelismo de datos o paralelismo de tareas)
- Las pilas de sistemas distribuidos son generalmente de código abierto y comúnmente heterogéneas
- Las pilas del sistema de clúster generalmente son ensambladas por una entidad, especialmente para un solo propósito para el que está construido
- Sospecho que la semántica entre un clúster y un sistema distribuido está desapareciendo lentamente y se usa indistintamente. ¡Entonces puede que no haya una diferencia después de todo!