URN Logo
UNIX Resources » Linux » China Linux Forum » Perl 编 程 » 2 » 想从html文件中,解析出内容,就是html2text,有没有办法?
announcement 声明: 本页内容为中国Linux论坛的内容镜像,文章的版权以及其他所有的相关权利属于中国Linux论坛和相应文章的作者,如果转载,请注明文章来源及相关版权信息。
Resources
China Linux Forum(finished)
Linux Forum(finished)
FreeBSD China(finished)
linuxforum.net
  业界新闻与评论
  自由软件杂谈
  IT 人生
  Linux软件快递
  翻译作坊
  Linux图书与评论
  GNU Emacs/XEmacs
  Linux 中文环境和中文化
  Linux桌面与办公软件
  Linux 多媒体与娱乐版
  自由之窗Mozilla
  笔记本电脑上的Linux
  Gentoo
  Debian 一族
  网络管理技术
  Linux 安装与入门
  WEB服务器和FTP服务器
  域名服务器和邮件服务器
  Linux防火墙和代理服务器应用
  文件及打印服务器
  技术培训与认证
  Linux内核技术
  Linux 嵌入技术
  Linux设备驱动程序
  Linux 集群技术
  LINUX平台数据库
  系统和网络安全
  CPU 与 编译器
  系统计算研究所专栏
  Linux下的GUI软件开发
  C/C++编程版
  PHP 技 术
  Java&jsp技术
  Shell编程技术
  Perl 编 程
  Python 编 程
  XML/Web Service 技术
  永远的Unix
  FreeBSD世界
   
想从html文件中,解析出内容,就是html2text,有没有办法?
 
 
 
Subject: 想从html文件中,解析出内容,就是html2text,有没有办法?
Author: webraider    Posted: 2005-08-09 11:20    Length: 38 byte(s)
[Original] [Print] [Top]
或者哪位前辈有经验,告诉小弟如何实施。
[Original] [Print] [Top]
Subject: Re: 想从html文件中,解析出内容,就是html2text,有没有办法?
Author: NetSnake    Posted: 2005-08-25 17:43    Length: 82 byte(s)
[Original] [Print] [Top]
对每一行做
$_ =~ s/<[^>]+>//g;
应该差不多吧
----
学习 ...
[Original] [Print] [Top]
Subject: Re: 想从html文件中,解析出内容,就是html2text,有没有办法?
Author: lonelyflyer    Posted: 2005-08-25 19:14    Length: 162 byte(s)
[Original] [Print] [Top]
use HTML::Parser;

HTML::Parser->new(text_h=>[sub {print shift}, 'text'])->parse_file("yourfile.html") or die $!;
----
OpenH323 is buggy
ACE is memory greedy
[Original] [Print] [Top]
« Previous thread
想写一个自动生成gdb调试文件的perl脚本
Perl 编 程
2
Next thread »
怎么设定perl使用的库的路径
     

Copyright © 2007 UNIX Resources Network, All Rights Reserved.      About URN | Privacy & Legal | Help | Contact us
备案序号: 京ICP备05006143    webmaster: webmaster@unixresources.net
This page created on 2008-07-17 04:08:54, cost 0.035177230834961 ms.