Java实现的爬虫抓取图片并保存操作示例

本文实例讲述了java实现的爬虫抓取图片并保存操作。分享给大家供大家参考，具体如下：

这是我参考了网上一些资料写的第一个java爬虫程序

本来是想获取煎蛋网无聊图的图片，但是网络返回码一直是503，所以换了网站

								
									 import   java.io.bufferedreader; 

									 import   java.io.fileoutputstream; 

									 import   java.io.ioexception; 

									 import   java.io.inputstream; 

									 import   java.io.inputstreamreader; 

									 import   java.io.outputstream; 

									 import   java.net.malformedurlexception; 

									 import   java.net.url; 

									 import   java.net.urlconnection; 

									 import   java.util.arraylist; 

									 import   java.util.list; 

									 import   java.util.regex.matcher; 

									 import   java.util.regex.pattern; 

									 /* 

									    * 网络爬虫取数据 

									    * 

									    * */ 

									 public   class   jiandan { 

									     public   static   string geturl(string inurl){ 

									       stringbuilder sb =   new   stringbuilder(); 

									       try   { 

									         url url =  new   url(inurl); 

									         bufferedreader reader =  new   bufferedreader(  new   inputstreamreader(url.openstream())); 

									         string temp=  ""  ; 

									         while  ((temp=reader.readline())!=  null  ){ 

									           //system.out.println(temp); 

									           sb.append(temp); 

									         } 

									       }   catch   (malformedurlexception e) { 

									         // todo 自动生成的 catch 块 

									         e.printstacktrace(); 

									       }   catch   (ioexception e) { 

									         // todo 自动生成的 catch 块 

									         e.printstacktrace(); 

									       } 

									       return   sb.tostring(); 

									     } 

									     public   static   list<string> getmatcher(string str,string url){ 

									       list<string> result =   new   arraylist<string>(); 

									       pattern p =pattern测试数据pile(url);  //获取网页地址 

									       matcher m =p.matcher(str); 

									       while  (m.find()){ 

									         //system.out.println(m.group(1)); 

									         result.add(m.group(  1  )); 

									       } 

									       return   result; 

									     } 

									     public   static   void   main(string args[]){ 

									       string str=geturl(  "http://HdhCmsTest163测试数据"  ); 

									       list<string> ouput =getmatcher(str,  "src=\"([\\w\\s./:]+?)\""  ); 

									       for  (string temp:ouput){ 

									         //system.out.println(ouput.get(0)); 

									         system.out.println(temp); 

									       } 

									       string aurl=ouput.get(  0  ); 

									        // 构造url 

									       url url; 

									       try   { 

									         url =   new   url(aurl); 

									          // 打开url连接 

									         urlconnection con = (urlconnection)url.openconnection(); 

									          // 得到url的输入流 

									         inputstream input = con.getinputstream(); 

									         // 设置数据缓冲 

									         byte  [] bs =   new   byte  [  1024   *   2  ]; 

									         // 读取到的数据长度 

									         int   len; 

									         // 输出的文件流保存图片至本地 

									         outputstream os =   new   fileoutputstream(  "a.png"  ); 

									         while   ((len = input.read(bs)) != -  1  ) { 

									         os.write(bs,   0  , len); 

									         } 

									         os.close(); 

									         input.close(); 

									       }   catch   (malformedurlexception e) { 

									         // todo 自动生成的 catch 块 

									         e.printstacktrace(); 

									       }   catch   (ioexception e) { 

									         // todo 自动生成的 catch 块 

									         e.printstacktrace(); 

									       } 

									     } 

									 }

运行输出：

希望本文所述对大家java程序设计有所帮助。

原文链接：https://blog.csdn.net/smilecjw/article/details/52423378

查看更多关于Java实现的爬虫抓取图片并保存操作示例的详细内容...

声明：本文来自网络，不代表【好得很程序员自学网】立场，转载请注明出处：http://www.haodehen.cn/did251269

更新时间：2023-07-21 阅读：171次