用户工具

站点工具


web:crawler.trains
urls=[]
$("a[href^='/train/']").each(function(idx){
	urls.push('http://qq.ip138.com'+$(this).attr('href'))
})
console.log(urls.length+' provinces')
crawl = {'urls':urls}
urls=[]
$("a[href^='/train/']").each(function(){
        href = $(this).attr('href')
        if(/^\/train\/\w+\/\w+/.test(href))
	urls.push('http://qq.ip138.com'+$(this).attr('href'))
})
console.log(urls.length+' cities')
crawl={"urls":urls}
lines=[]
$("#checilist>table>tr:has(td)").each(function(){
	line = {
		'车次': $(this).find('td:nth-child(1) > a > b').text().trim(),
		'网址': $(this).find('td:nth-child(1) > a').attr('href'),
		'列车类型': $(this).find('td:nth-child(2)').text().trim(),
		'始发站': $(this).find('td:nth-child(3)').text().trim(),
		'始发时间': $(this).find('td:nth-child(4)').text().trim(),
		'经过站': $(this).find('td:nth-child(5)').text().trim(),
		'经过站到达时间': $(this).find('td:nth-child(6)').text().trim(),
		'经过站发车时间': $(this).find('td:nth-child(7)').text().trim(),
		'终点站': $(this).find('td:nth-child(8)').text().trim(),
		'到达时间': $(this).find('td:nth-child(9)').text().trim(),
	}
	lines.push(line)
	console.log(line)
})
console.log(lines.length+' lines')
urls=[]
data=[]
lines.forEach(function(line){
	urls.push('http://qq.ip138.com'+line.网址)
	var item = {}
	item['hset_train_'+line.车次] = line
	data.push(item)
})
crawl={"urls": urls, "data": data}
stations=[]
$("#stationInfo tr:has(td)").each(function(){
	station = {
		'车站': $(this).find('td:nth-child(2)').text().trim(),
		'到达时间': $(this).find('td:nth-child(3)').text().trim(),
		'发车时间': $(this).find('td:nth-child(4)').text().trim(),
		'走行时间(小时)': $(this).find('td:nth-child(5)').text().trim(),
		'里程(公里)': $(this).find('td:nth-child(6)').text().trim(),
	}
	stations.push(station)
	console.log(station)
})
line=$('#tid').val().toUpperCase()
console.log(line+' has '+stations.length+' stations')
item={'stations':stations}
data={}
data['hset_trains_'+line] = item
crawl={'data':data}
web/crawler.trains.txt · 最后更改: 2019/07/01 23:36 由 admin