含有中文字符的url的构造方法–php构造url-curl

作者: Rememberautumn 分类: 未分类 发布时间: 2014-11-16 13:27 阅读: 8,993

在做一些网站的搜索信息抓取的时候,我们需要构造url来发送数据,例如采集当当网的搜索结果就需要对url进行构造。 http://search.dangdang.com/?key=java%E7%A8%8B%E5%BA%8F%E8%AE%BE%E8%AE%A1这是我在搜java程序设计的时候搜索结果页面的url, key=后面则是我们搜索的关键字,url的编码有两种方式,可以使用 urlencode() 或者 rawurlencode(),二者的区别是前者把空格编码为 ‘+’,而后者把空格编码为 ‘%20’,不过应该注意的是,在编码时应该只对部分URL编码,否则URL中的冒号和反斜杠也会被转义。

mb_convert_encoding//网页是utf-8进行编码的,而当当是gb2312编码,所以要先进行转码再进行url的构造。

关于mb_convert_encoding请查看http://www.fddcn.cn/php-curl-post.html

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

发表评论

电子邮件地址不会被公开。 必填项已用*标注