java抓取网页数据-java抓取网站数据
发布时间:2023-02-12 07:13 浏览次数:次 作者:佚名
js抓取网页数据其实很简单,没那么复杂。 需要配合3个函数使用: indexOf 返回指定字符串值在字符串中第一次出现的位置 lastIndexOf 返回指定字符串值最后出现的位置 Position substring 提取字符串中两个指定下标之间的字符
简单的说就是获取元素的起始位置和结束位置java抓取网页数据,然后提取得到结果。
1.获取网页数据
二、封装和提取数据的方法
getAlarms(val,later,before){
var alarm=val;
//某个指定字符之后
![java抓取网页数据_java抓取网站数据_java抓取网页中文乱码](https://exp-picture.cdn.bcebos.com/5917cb3da824d8e913f7d6d0da598540112ac8bf.jpg?x-bce-process=image/resize,m_lfit,w_500,limit_1)
var index=alarm.indexOf(later);
alarm=alarm.substring(index+1,alarm.length);
//某个指定字符之前
index=alarm.lastIndexOf(before);
alarm=alarm.substring(0,index);
return alarm
},
![java抓取网页中文乱码_java抓取网站数据_java抓取网页数据](https://exp-picture.cdn.bcebos.com/777f3fc2bbd6e1d02da43dd20d254193cfe8afe3.jpg?x-bce-process=image/resize,m_lfit,w_500,limit_1)
3. 多次数据提取(常规)
//去除空数组
removerNull(arr){
for(var i = 0;i<arr.length;i++){
if(arr[i]==''||arr[i]==null||typeof(arr[i])==undefined){
arr.splice(i,1);
![java抓取网页中文乱码_java抓取网站数据_java抓取网页数据](https://exp-picture.cdn.bcebos.com/423041db3620b93a839d9c73ad0f8835dc8a8aae.jpg?x-bce-process=image/resize,m_lfit,w_500,limit_1/quality,q_80)
i=i-1;
}
}
return arr;
},
//某个元素之后,某个元素之前
getlaterAndbefore2(val,later,before){
var alarm=val;
//某个指定字符之后
![java抓取网页数据_java抓取网页中文乱码_java抓取网站数据](https://images.cnitblog.com/blog/562990/201412/142206348215864.png)
var index=alarm.indexOf(later);
alarm=alarm.substring(index,alarm.length);
//某个指定字符之前
index=alarm.indexOf(before);
alarm=alarm.substring(0,index);
return alarm
},
//某个元素之后 +1
![java抓取网页中文乱码_java抓取网页数据_java抓取网站数据](https://p3.itc.cn/q_70/images03/20210105/d83db152c835471d8cdf479351f9a7fe.png)
getlater1(val,later){
var alarm=val;
//某个指定字符之后
var index=alarm.indexOf(later);
alarm=alarm.substring(index+1,alarm.length);
return alarm
},
效果我就不演示了java抓取网页数据,再见