如果要对用户投票的话就必须先填写验证码!由于验证码是图片,而且是随即的,所以对自动提交数据增加了很大的难度。因此,如果要提交投票就必须先得到验证码!
难点:(1)取得验证码图片并识别成相应数据;(2)提交数据表单。
首先我们来剖析一下本页面的 html 源代码,代码如下:
… …
<table>
<form name="form1" method="post" action="photo_vote.asp">
<input type="hidden" name="id" value="{525147e1-c4a7-41ee-9190-95800ac81e29}">
<tr>
<td>请输入4位数字验证码:
<input type="text" name="checkcode" size=4><img src="count.asp?
sksid=624be861d1ff9641de7f1d1ff967c1e711d1ff95cd5e9b1d1ff9|3812d0|1af2d7">
<input type="submit" name="submit" value="投 票">
<input type="button" value="关 闭" onclick="javascript:window.close()"></td>
</tr>
</form>
</table>
… …
为了保证代码的易读性,进行了相应的处理,并省略了部分无用的代码!不难看出的是:
(1)表单的名称是:form1 ; 提交的页面是:photo_vote.asp ; 提交方式是:post
(2)表单提交的数据有:id 和 checkcode 。其中 id 为隐藏域,内容是:{525147e1-c4a7-41ee-9190-95800ac81e29}
(3)验证码的图片文件为:count.asp?sksid=624be861d1ff9641de7f1d1ff967c1e711d1ff95c
d5e9b1d1ff9|3812d0|1af2d7 它是由 count.asp 随即动态生成,存在不确定性!
(4)在网页的验证码的图片上按右键,保存图片时显示为:count.xbm 即图片的格式为:xbm
通过上面的分析,问题就可以一个一个解决了。
【表单的提交】
表单的提交有几种方式,常用的有两种:一是直接提交含表单提交数据的网址;二是修改原表单,然后提交新数据!
对于第一种,我们在得到验证码后可以这样发送:http://www.motorola.com.cn/news/925/photo_vote.asp?id={
525147e1-c4a7-41ee-9190-95800ac81e29}&checkcode=6793
然而由于摩托罗拉的网站对 cookies 进行了操作,这样做起来不是很好,而且也难成功,所以我们直能改用第二种方法,修改原有的表单。
首先,利用 webbrowers 控件取得网页源代码(具体方法,请参考:
http://www.cndevx.com/tips/showdoc.asp?detail_id=1337)利用vb中的 replace 函数将原表单网页的代码修改成:
… …
<table>
<form name="form1" method="post" action="
http://www.motorola.com.cn/news/925/photo_vote.asp";>
<input type="hidden" name="id" value="{525147e1-c4a7-41ee-9190-95800ac81e29}">
<tr>
<td>请输入4位数字验证码: <input type="text" name="checkcode" size=4 value=6739><img src="count.asp? sksid=624be861d1ff9641de7f1d1ff967c1e711d1ff95cd5e9b1d1ff9|3812d0|1af2d7">
<script>
form1.submit();
</script>
<input type="button" value="关 闭" onclick="javascript:window.close()"></td>
</tr>
</form>
</table>
… …
然后利用 webbrowers.document.write htmlcodes 方式,讲替换的 html 代码重新写入 webbrowers 控件里面, webbrowers 控件将自动运行新的代码,即自动提交了数据!
这样,整个提交过程就自动完成了,如果我们再加上相应的时间控制或者其他网站的话,就可以实现自动刷新和消息群发了!
【xbm 图片文件】
xbm(x bitmap)一种图形文件格式
文件结构类似如下:
#define counter_width 32 //定义图片宽(象素)
#define counter_height 10 //定义图片高(象素)
static unsigned char counter_bits[]={
0x3c,0x3c,0xfe,0x3c,0x66,0x66,0xfe,0x66,0xc3,0xc3,0x06,0x60,0x66,0x66,0x06,
0x60,0x3c,0x3c,0x3e,0x30,0x66,0x66,0x60,0x18,0xc3,0xc3,0xc0,0x0c,0xc3,0xc3,0xc3,
0x06,0x66,0x66,0x66,0x06,0x3c,0x3c,0x3c,0x7e};
// 图像数据,采取16进制格式的,还原图像时需转换成二进制后数据反向,否则图片将是反的
得到 xbm 图片,分离成相应的字符,然后与预先的图片文件比较,即可得出此图像代表的数字,即所谓的识别!
演示程序:http://www.cndevx.com/club/uploadfile/2003941042070557.rar
源 代 码:http://www.cndevx.com/club/uploadfile/20039410421872749.rar
=========================
附:使用vb获得一页的html代码
加入webbrowser、timer、commandbutton控件各一个,然后使用以下代码:
private sub command1_click()
webbrowser1.navigate "http://www.motorola.com.cn/news/925/photo_vote.asp?id=
{525147e1-c4a7-41ee-9190-95800ac81e29}"
timer1.enabled = true
end sub
private sub timer1_timer()
dim doc, objhtml as object
dim i as integer
dim strhtml as string
if not webbrowser1.busy then
set doc = webbrowser1.document
i = 0
set objhtml = doc.body.createtextrange()
if not isnull(objhtml) then
text1.text = objhtml.htmltext
end if
&nsp; timer1.enabled = false
end if
end sub
这是网上流行的一种方法,但是从我使用来看,因为 webbrowers 控件本身有 documentcomplete 事件,也就是
说并不需要使用 timer 控件!(csdn)
|