Esta pregunta podría tener muchas respuestas.
Lo primero que debe tener en cuenta es que su pregunta debe redactarse mejor: la publicación en el blog de Seth YA está en formato de texto; así que no necesitas convertir nada.
Lo que realmente quiere decir, y esto queda claro en su comentario de seguimiento, es que desea descargar cada publicación como un archivo de texto individual, ¿verdad? ¿Es eso correcto?
- ¿Cuál es la diferencia entre diferentes herramientas de raspado web? ¿Podría alguien especificar más, ya que no pude encontrar mucha diferencia en sus sitios web?
- ¿Hay un sitio web donde pueda alquilar mis canoas y equipo de campamento?
- Cómo construir un sitio web AngularJS
- Cómo citar un sitio web en texto en APA si no conozco al autor
- Mi sitio de WordPress no está en la raíz de mi sitio web. ¿Cómo lo coloco en la raíz mientras mantengo mi wp-admin y sitio funcionando?
Dado que este es un “quórum” y no un sitio técnico, me atendré al código psuedo:
- Obtenga el feed RSS
- Encuentre una línea de código simple que divida el RSS en publicaciones individuales; vale la pena mirar esta: Magpie RSS – PHP RSS Parser
require (‘rss_fetch.inc’);
$ rss = fetch_rss ($ url);
require_once ‘rss_fetch.inc’;
$ url = ‘http://magpie.sf.net/samples/imc.1-0.rdf’;
$ rss = fetch_rss ($ url);
echo “Sitio:”, $ rss-> canal [‘título’], “
“;
foreach ($ rss-> artículos como $ artículo) {
$ title = $ item [título];
$ url = $ item [enlace];
echo “ $ title
“;
}
- Escriba cada uno en un solo archivo txt en su sistema. Aquí está todo lo que necesita para hacer esto en Java
ReadFromWeb.java