您的位置:

jsoup带cookies(jsoup是什么意思)

jsoup带cookies(jsoup是什么意思)

更新:

本文目录一览:

Jsoup发送http请求,get和post两种方式,分别带参数和不带参数

dependency

groupIdorg.jsoup/groupId

        artifactIdjsoup/artifactId

version1.10.3/version

/dependency

public void JsoupGet() throws Exception{

Connection connect = Jsoup.connect(";password=lisi");

// 带参数开始

connect.data("username","zhangsan");

connect.data("password","lisi");

// 带参数结束

Document document = connect.get();

System.out.println(document.toString());

}

public void JsoupPost() throwsException{

Connection connect = Jsoup.connect(";password=lisi");

// 带参数开始

connect.data("username","zhangsan");

connect.data("password","lisi");

// 带参数结束

Document document = connect.post();

System.out.println(document.toString());

}

求真正有效的可以模拟登录新浪微博的java代码,后续可以用Jsoup进行抓取。急急!!登录成功马上给分!

package jsoupTest;

import java.io.IOException;

import java.util.ArrayList;

import java.util.HashMap;

import java.util.List;

import java.util.Map;

import org.jsoup.Connection.Method;

import org.jsoup.Connection.Response;

import org.jsoup.Jsoup;

public class JsoupTest {

  public static void main(String[] args) throws IOException {

    MapString, String map = new HashMap();

    //map.put请根据自己的微博cookie得到

    Response res = Jsoup.connect("别人的主页id")

        .cookies(map).method(Method.GET).execute();

    String s = res.body();

    System.out.println(s);

    String[] ss = s.split("scriptFM.view");

    int i = 0;

    // pl_content_homeFeed

    // pl.content.homeFeed.index

    ListString list = new ArrayList();

    for (String x : ss) {

// System.out.println(i++ + "======================================");

// System.out.println(x.substring(0,

// x.length()  200 ? 200 : x.length()));

// System.out.println("===========================================");

      if (x.contains("\"html\":\"")) {

        String value = getHtml(x);

        list.add(value);

        System.out.println(value);

      }

    }

    // content=ss[8].split("\"html\":\"")[1].replaceAll("(\\\\t|\\\\n)",

    // "").replaceAll("\\\\\"", "\"").replaceAll("\\\\/", "/");

    // content=content.substring(0,

    // content.length()=13?content.length():content.length()-13);

    // System.out.println(Native2AsciiUtils.ascii2Native(content));

  }

  public static String getHtml(String s) {

    String content = s.split("\"html\":\"")[1]

        .replaceAll("(\\\\t|\\\\n)", "").replaceAll("\\\\\"", "\"")

        .replaceAll("\\\\/", "/");

    content = content.substring(0,

        content.length() = 13 ? content.length()

            : content.length() - 13);

    return Native2AsciiUtils.ascii2Native(content);

  }

java的Jsoup登录有验证码网页获取登录后的cookie

首先是jar仓库:

dependency

groupIdorg.seleniumhq.selenium/groupId

artifactIdselenium-java/artifactId

version[3.0.1,)/version//获取最新的版本库

/dependency

dependency

groupIdorg.jsoup/groupId

artifactIdjsoup/artifactId

version1.8.2/version

typejar/type

/dependency

代码:

public static void getIndex2() {

//之前运行程序发现生成了N多个chrome driver进程,搞不懂为什么会有那么多进程产生,网上查了下,说起这个service有用,拿来试下,效果未知

ChromeDriverService service = new

ChromeDriverService.Builder().usingDriverExecutable(new

File("./driver/chromedriver.exe")).usingAnyFreePort().build();

try {

service.start();

} catch (IOException ex) {

Logger.getLogger(kechengbiaoIndex.class.getName()).log(Level.SEVERE, null, ex);

}

//end

//正式开始

//先定义浏览器驱动,我用chrome浏览器,网上下载一个chromedriver.exe,启动时需要加载

System.getProperties().setProperty("webdriver.chrome.driver", "./driver/chromedriver.exe");

Jsoup或者HttpClient抓取web页面时,data,userAgent,cookie(),timeout(),post();为什么要设置这些?

userAgent让服务器感觉访问者更像一个真实的浏览器在访问,cookie是看服务器需不需要,timeout还需要解释吗,你不设置有一个默认的超时时间

jsoup带cookies(jsoup是什么意思)

本文目录一览: 1、Jsoup发送http请求,get和post两种方式,分别带参数和不带参数 2、求真正有效的可以模拟登录新浪微博的java代码,后续可以用Jsoup进行抓取。急急!!登录成功马上给

2023-12-08
jsoup携带cookie(jsoup怎么用)

本文目录一览: 1、jsoup教程 2、Jsoup或者HttpClient抓取web页面时,data,userAgent,cookie(),timeout(),post();为什么要设置这些? 3、使

2023-12-08
jsoup获取headercookie,jsoup获取标签内

2022-11-27
jsoup设置cookie,jsoup修改html内容

2023-01-03
javajsoup用法(java jsoup)

本文目录一览: 1、java jsoup怎样爬取特定网页内的数据 2、java怎样读取html文件 3、java使用jsoup采集网站数据 4、详解如何基于Java用Jsoup爬虫HTML数据 jav

2023-12-08
jsoup填充cookie获取数据,jsoup设置cooki

2023-01-04
java使用jsoup简单爬虫,jsoup爬取网页

本文目录一览: 1、java jsoup怎样爬取特定网页内的数据 2、java爬虫抓取指定数据 3、如何用java爬虫爬取招聘信息 java jsoup怎样爬取特定网页内的数据 1、Jsoup简述 J

2023-12-08
jsoup程序中使用代理(jsoup教程)

本文目录一览: 1、如何在爬虫中设置代理服务器HttpClient,可以连续爬取,请老师给具体代码,谢谢! 2、java jsoup怎样爬取特定网页内的数据 3、Jsoup如何在设有有代理的网络中解析

2023-12-08
JSoup在Web页面解析中的应用

2023-05-20
利用JSoup和Maven优化网页元素

2023-05-16
使用Maven和Jsoup提高网站的搜索引擎排名

2023-05-16
jsjsj是什么意思,jsdj是什么意思

2022-11-26
采集蛙java爬虫教学视频2的简单介绍

2022-11-16
java爬虫,java爬虫与python爬虫的区别

2022-11-27
java实现网页爬虫的示例讲解(java爬虫爬取网页内容)

2022-11-14
java抓取网页数据实现下载(java如何爬取网页数据)

2022-11-10
Java HTML解析器的综合介绍

2023-05-16
每日java学习笔记(java高手笔记)

2022-11-15
爬虫java,爬虫java框架

2023-01-09
java解析html,java解析xml字符串

2023-01-07