Hola,
Gracias por el A2A.
Aquí hay una biblioteca que de acuerdo con la descripción debería poder hacerlo: zopyx.convert2 2.4.5
- ¿Cómo diseñaría e implementaría un rastreador web que funciona para múltiples sitios web?
- ¿Cuáles son excelentes ejemplos de textos de héroes innovadores en las páginas de destino?
- ¿Scijournal.org es un sitio web falso?
- ¿Todavía es posible convertirse en millonario de un sitio web?
- ¿Qué es lo más obvio que falta en IMDB para un usuario nuevo / regular?
Una advertencia: no he podido hacerlo funcionar hasta ahora.
No conozco ninguna otra biblioteca que lo haga.
Entonces, de otra manera: si está utilizando Windows y tiene Microsoft Word, puede hacer lo siguiente. En el sitio web, haga clic derecho y guarde el archivo HTML en su computadora.
Abra Word y abra el documento con él. Luego puede guardar el archivo en el formato que desee.
Ahora, con Python y la biblioteca win32com, puede automatizar el proceso:
importar win32com.client como win32
ms_word = win32.Dispatch (‘Word.Application’)
ms_doc = ms_word.Documents.Add (‘your_website.html’)
ms_doc.SaveAs (‘your_word_doc.doc’)
ms_doc.Close ()
ms_word.Quit ()
Fuente: Conversión de HTML a DOC con apariencia
Con Linux, quizás podría usar abiword –to = doc filename.odt (Fuente: Convertir HTML a odt, doc, docx)
Avísame si puedo ayudarte.
Saludos