|
最近想搞一个采集啊里妈妈的商品但是就卡在登录那里了
用webbrows进行登录,登录后获取的COOKIES都不对用不了,不知道是不是我的写法有问题
HttpHelper http = new HttpHelper();
HttpItem item = new HttpItem()
{
URL = "http://pub.alimama.com/common/getUnionPubContextInfo.json",//URL 必需项
//Method = "get",//URL 可选项 默认为Get
Timeout = 100000,//连接超时时间 可选项默认为100000
ReadWriteTimeout = 30000,//写入Post数据超时时间 可选项默认为30000
IsToLower = false,//得到的HTML代码是否转成小写 可选项默认转小写
Cookie = MainCookie.Cookie,//字符串Cookie 可选项
UserAgent = "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; Win64; x64; Trident/5.0; .NET CLR 2.0.50727; SLCC2; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET4.0C; .NET4.0E)",//用户的浏览器类型,版本,操作系统 可选项有默认值
Accept = "*/*",// 可选项有默认值
ContentType = "application/x-www-form-urlencoded; charset=UTF-8",//返回类型 可选项有默认值
Referer = "http://pub.alimama.com/myunion.htm?spm=a2320.7388781.a214tr8.d006.pGtpeN",//来源URL 可选项
Host = "pub.alimama.com",
// X-Requested-With = "",
// Allowautoredirect = False,//是否根据301跳转 可选项
AutoRedirectCookie =true,//是否自动处理Cookie 可选项
//CerPath = "d:\123.cer",//证书绝对路径 可选项不需要证书时可以不写这个参数
//Connectionlimit = 1024,//最大连接数 可选项 默认为1024
// Postdata = "action=Pu00011_result&Pu00011_Input.trade_date=20160901&Pu00011_Input.variety=all&Pu00011_Input.trade_type=0&Submit=%B2%E9+%D1%AF",//Post数据 可选项GET时不需要写
//ProxyIp = "192.168.1.105:2020",//代理服务器ID 可选项 不需要代理 时可以不设置这三个参数
//ProxyPwd = "123456",//代理服务器密码 可选项
//ProxyUserName = "administrator",//代理服务器账户名 可选项
ResultType = ResultType.String,//返回数据类型,是Byte还是String
};
HttpResult result = http.GetHtml(item);
string html = result.Html;
string cookie = result.Cookie;
richTextBox1.Text = html;
读取的时候就是无法登录的
|
|