URN Logo
UNIX Resources » Linux » China Linux Forum » Python 编 程 » 4 » 如何打开使用cookie信息的网页
announcement 声明: 本页内容为中国Linux论坛的内容镜像,文章的版权以及其他所有的相关权利属于中国Linux论坛和相应文章的作者,如果转载,请注明文章来源及相关版权信息。
Resources
China Linux Forum(finished)
Linux Forum(finished)
FreeBSD China(finished)
linuxforum.net
  业界新闻与评论
  自由软件杂谈
  IT 人生
  Linux软件快递
  翻译作坊
  Linux图书与评论
  GNU Emacs/XEmacs
  Linux 中文环境和中文化
  Linux桌面与办公软件
  Linux 多媒体与娱乐版
  自由之窗Mozilla
  笔记本电脑上的Linux
  Gentoo
  Debian 一族
  网络管理技术
  Linux 安装与入门
  WEB服务器和FTP服务器
  域名服务器和邮件服务器
  Linux防火墙和代理服务器应用
  文件及打印服务器
  技术培训与认证
  Linux内核技术
  Linux 嵌入技术
  Linux设备驱动程序
  Linux 集群技术
  LINUX平台数据库
  系统和网络安全
  CPU 与 编译器
  系统计算研究所专栏
  Linux下的GUI软件开发
  C/C++编程版
  PHP 技 术
  Java&jsp技术
  Shell编程技术
  Perl 编 程
  Python 编 程
  XML/Web Service 技术
  永远的Unix
  FreeBSD世界
   
如何打开使用cookie信息的网页
如何打开使用cookie信息的网页 - dorothywu [2005-11-29 10:11 | 444 byte(s)]
 
Re: 如何打开使用cookie信息的网页 - passworld [2005-11-29 14:43 | 532 byte(s)]
 
Re: 如何打开使用cookie信息的网页 - dorothywu [2005-12-01 10:15 | 316 byte(s)]
 
Re: 如何打开使用cookie信息的网页 - limodou [2005-12-01 11:56 | 26 byte(s)]
 
Subject: 如何打开使用cookie信息的网页
Author: dorothywu    Posted: 2005-11-29 10:11    Length: 444 byte(s)
[Original] [Print] [Top]
比如一个网页,缺省是英文的页面。
我通过网页上的链接,设置成中文的页面,中文等相关信息是保存在cookie中的。
如果以后用浏览器再去看的话,就一直会是中文的了。

但如果我用python语句去抓取网页时,
opener = urllib.URLopener()
opener.retrieve( htmlUrl, "temp.html" )
发现抓到的总还是英文的页面,
有什么办法可以让它读到cookie的设置,这样我下载下来的就可以是中文的页面了?
[Original] [Print] [Top]
Subject: Re: 如何打开使用cookie信息的网页
Author: passworld    Posted: 2005-11-29 14:43    Length: 532 byte(s)
[Original] [Print] [Top]
python 2.4 urllib2 里有 HTTPCookieProcessor handler,当然还要用到 cookielib 这个模块。

import cookielib, urllib2
cookiejar = cookielib.MozillaCookieJar()
cookiejar.load(os.path.join(cmdpath, 'cookies.txt'))
httpcookie = urllib2.HTTPCookieProcessor(cookiejar)
opener = urllib2.build_opener(httpcookie)
fobj = opener.open(.........................)


这个 cookies.txt 直接把 mozilla 的复制过来就可以,当然也可以自己存一个。

----
[Original] [Print] [Top]
Subject: Re: 如何打开使用cookie信息的网页
Author: dorothywu    Posted: 2005-12-01 10:15    Length: 316 byte(s)
[Original] [Print] [Top]
謝謝passworld的指导。

我现在已经能够抓到中文网页了。
而且幸运的是这个cookie用到2015年才会过期。
所以我把mozilla的cookies.txt拷贝过去就可以用了。

但我在想,最好还是通过程序把cookie抓下来比较好。
cookielib模块应该有这样的功能吧?
等下再试试看。
[Original] [Print] [Top]
Subject: Re: 如何打开使用cookie信息的网页
Author: limodou    Posted: 2005-12-01 11:56    Length: 26 byte(s)
[Original] [Print] [Top]
你摸拟一下登录过程就行了。
----
[Original] [Print] [Top]
« Previous thread
安装wxpython 后运行出现错误,
Python 编 程
4
Next thread »
道语言最新版本0.9.6beta发布!
     

Copyright © 2007 UNIX Resources Network, All Rights Reserved.      About URN | Privacy & Legal | Help | Contact us
备案序号: 京ICP备05006143    webmaster: webmaster@unixresources.net
This page created on 2008-07-17 04:10:58, cost 0.063323974609375 ms.