当前位置: 首页 > news >正文

Java获取URL中的顶级域名domain的工具类

方式一:

 1 import java.net.MalformedURLException;
 2 import java.net.URL;
 3 import java.util.Arrays;
 4 import java.util.HashSet;
 5 import java.util.Set;
 6 import java.util.regex.Pattern;
 7 
 8 public class URLUtil {
 9 
10     private final static Set<String> PublicSuffixSet = new HashSet<String>(
11             Arrays.asList(new String(
12                     "com|org|net|gov|edu|co|tv|mobi|info|asia|xxx|onion|cn|com.cn|edu.cn|gov.cn|net.cn|org.cn|jp|kr|tw|com.hk|hk|com.hk|org.hk|se|com.se|org.se")
13                     .split("\\|")));
14 
15     private static Pattern IP_PATTERN = Pattern.compile("(\\d{1,3}\\.){3}(\\d{1,3})");
16 
17     /**
18      * 获取url的顶级域名
19      * @param url
20      * @return
21      */
22     public static String getDomainName(URL url) {
23         String host = url.getHost();
24         if (host.endsWith(".")){
25             host = host.substring(0, host.length() - 1);
26         }
27         if (IP_PATTERN.matcher(host).matches()){
28             return host;
29         }
30 
31         int index = 0;
32         String candidate = host;
33         for (; index >= 0;) {
34             index = candidate.indexOf('.');
35             String subCandidate = candidate.substring(index + 1);
36             if (PublicSuffixSet.contains(subCandidate)) {
37                 return candidate;
38             }
39             candidate = subCandidate;
40         }
41         return candidate;
42     }
43 
44     /**
45      * 获取url的顶级域名
46      * @param url
47      * @return
48      * @throws MalformedURLException
49      */
50     public static String getDomainName(String url) throws MalformedURLException {
51         return getDomainName(new URL(url));
52     }
53 
54     /**
55      * 判断两个url顶级域名是否相等
56      * @param url1
57      * @param url2
58      * @return
59      */
60     public static boolean isSameDomainName(URL url1, URL url2) {
61         return getDomainName(url1).equalsIgnoreCase(getDomainName(url2));
62     }
63 
64     /**
65      * 判断两个url顶级域名是否相等
66      * @param url1
67      * @param url2
68      * @return
69      * @throws MalformedURLException
70      */
71     public static boolean isSameDomainName(String url1, String url2)
72             throws MalformedURLException {
73         return isSameDomainName(new URL(url1), new URL(url2));
74     }
75     
76     public static void main(String[] args) throws Exception {
77         String urlStr = "http://news.hexun.com/2017-09-23/190978248.html";
78         getDomainName(urlStr);
79         getDomainName(new URL(urlStr));
80     }
81 
82 }

方式二:

 1 import java.net.MalformedURLException;
 2 import java.net.URL;
 3 import java.util.regex.Matcher;
 4 import java.util.regex.Pattern;
 5 
 6 public class DomainUtils {
 7     /**
 8      * 获取url的顶级域名
 9      * @param
10      * @return
11      */
12     public static String getTopDomain(String url){
13         try{
14             //获取值转换为小写
15             String host = new URL(url).getHost().toLowerCase();//news.hexun.com
16             Pattern pattern = Pattern.compile("[^\\.]+(\\.com\\.cn|\\.net\\.cn|\\.org\\.cn|\\.gov\\.cn|\\.com|\\.net|\\.cn|\\.org|\\.cc|\\.me|\\.tel|\\.mobi|\\.asia|\\.biz|\\.info|\\.name|\\.tv|\\.hk|\\.公司|\\.中国|\\.网络)");
17             Matcher matcher = pattern.matcher(host);
18             while(matcher.find()){
19                 return matcher.group();
20             }
21         }catch(MalformedURLException e){
22             e.printStackTrace();
23         }
24         return null;
25     }
26     public static void main(String[] args) {
27         System.out.println(getTopDomain("http://news.hexun.com/2017-09-23/190978248.html"));//hexun.com
28 
29     }
30 }

 

转载于:https://www.cnblogs.com/DreamDrive/p/7594305.html

相关文章:

  • CSS实现空心三角指示箭头
  • TPYBoard开发板ADC数模转换一: 初识ADC使用
  • no.4 数据和C 06
  • W3School Redis教程(安装/基本操作/高级操作/命令/官方文档/官方集群教程)
  • Go语言与数据库开发:01-06
  • js 日期计算
  • vue 请求后台数据
  • Unity3D-RayMarch-几何图元-3添加阴影
  • es6--symbol
  • 元组、函数详解
  • jQuery基本过滤选择器
  • HTML5实现文字轮滚
  • App案例分析——XBMC
  • Hadoop- Hadoop详解
  • numpy的random模块
  • [iOS]Core Data浅析一 -- 启用Core Data
  • 【跃迁之路】【463天】刻意练习系列222(2018.05.14)
  • 2019.2.20 c++ 知识梳理
  • 5、React组件事件详解
  • Angular 响应式表单 基础例子
  • Docker 笔记(1):介绍、镜像、容器及其基本操作
  • gcc介绍及安装
  • iOS 颜色设置看我就够了
  • Java基本数据类型之Number
  • JS进阶 - JS 、JS-Web-API与DOM、BOM
  • node.js
  • nodejs:开发并发布一个nodejs包
  • orm2 中文文档 3.1 模型属性
  • React 快速上手 - 06 容器组件、展示组件、操作组件
  • springboot_database项目介绍
  • 理清楚Vue的结构
  • 浅谈web中前端模板引擎的使用
  • 容器化应用: 在阿里云搭建多节点 Openshift 集群
  • 通过来模仿稀土掘金个人页面的布局来学习使用CoordinatorLayout
  • 一加3T解锁OEM、刷入TWRP、第三方ROM以及ROOT
  • 异常机制详解
  • LevelDB 入门 —— 全面了解 LevelDB 的功能特性
  • 阿里云IoT边缘计算助力企业零改造实现远程运维 ...
  • $.extend({},旧的,新的);合并对象,后面的覆盖前面的
  • (PyTorch)TCN和RNN/LSTM/GRU结合实现时间序列预测
  • (差分)胡桃爱原石
  • (二)springcloud实战之config配置中心
  • (附源码)ssm基于jsp高校选课系统 毕业设计 291627
  • (附源码)计算机毕业设计SSM基于java的云顶博客系统
  • (附源码)计算机毕业设计SSM智能化管理的仓库管理
  • (六)库存超卖案例实战——使用mysql分布式锁解决“超卖”问题
  • (四)【Jmeter】 JMeter的界面布局与组件概述
  • (学习日记)2024.04.04:UCOSIII第三十二节:计数信号量实验
  • (一)eclipse Dynamic web project 工程目录以及文件路径问题
  • (一)基于IDEA的JAVA基础10
  • (最完美)小米手机6X的Usb调试模式在哪里打开的流程
  • .NET 8.0 中有哪些新的变化?
  • .net 受管制代码
  • .Net中wcf服务生成及调用
  • ?