当前位置: 主页 > JAVA语言

java抓取网页数据-java抓取网站数据

发布时间:2023-02-12 07:13   浏览次数:次   作者:佚名

js抓取网页数据其实很简单,没那么复杂。 需要配合3个函数使用: indexOf 返回指定字符串值在字符串中第一次出现的位置 lastIndexOf 返回指定字符串值最后出现的位置 Position substring 提取字符串中两个指定下标之间的字符

简单的说就是获取元素的起始位置和结束位置java抓取网页数据,然后提取得到结果。

1.获取网页数据

在这里插入图片描述

在这里插入图片描述

二、封装和提取数据的方法

		getAlarms(val,later,before){
				var alarm=val;
				//某个指定字符之后

java抓取网页数据_java抓取网站数据_java抓取网页中文乱码

var index=alarm.indexOf(later); alarm=alarm.substring(index+1,alarm.length); //某个指定字符之前 index=alarm.lastIndexOf(before); alarm=alarm.substring(0,index); return alarm },

java抓取网页中文乱码_java抓取网站数据_java抓取网页数据

3. 多次数据提取(常规)

在这里插入图片描述

在这里插入图片描述

			//去除空数组
			removerNull(arr){
				for(var i = 0;i<arr.length;i++){
				    if(arr[i]==''||arr[i]==null||typeof(arr[i])==undefined){
				        arr.splice(i,1);

java抓取网页中文乱码_java抓取网站数据_java抓取网页数据

i=i-1; } } return arr; }, //某个元素之后,某个元素之前 getlaterAndbefore2(val,later,before){ var alarm=val; //某个指定字符之后

java抓取网页数据_java抓取网页中文乱码_java抓取网站数据

var index=alarm.indexOf(later); alarm=alarm.substring(index,alarm.length); //某个指定字符之前 index=alarm.indexOf(before); alarm=alarm.substring(0,index); return alarm }, //某个元素之后 +1

java抓取网页中文乱码_java抓取网页数据_java抓取网站数据

getlater1(val,later){ var alarm=val; //某个指定字符之后 var index=alarm.indexOf(later); alarm=alarm.substring(index+1,alarm.length); return alarm },

效果我就不演示了java抓取网页数据,再见