pywhois: whois/__init__.py@1fe2c20adeba (annotated)

70 1fe2c20adeba Python3 support Johnny Wezel<j@wezel.name> parents: 60 diff changeset	1	from __future__ import print_function
1fe2c20adeba Python3 support Johnny Wezel<j@wezel.name> parents: 60 diff changeset	2	from __future__ import absolute_import
1fe2c20adeba Python3 support Johnny Wezel<j@wezel.name> parents: 60 diff changeset	3	from __future__ import unicode_literals
1fe2c20adeba Python3 support Johnny Wezel<j@wezel.name> parents: 60 diff changeset	4	from __future__ import division
1fe2c20adeba Python3 support Johnny Wezel<j@wezel.name> parents: 60 diff changeset	5	from future import standard_library
1fe2c20adeba Python3 support Johnny Wezel<j@wezel.name> parents: 60 diff changeset	6	standard_library.install_aliases()
1fe2c20adeba Python3 support Johnny Wezel<j@wezel.name> parents: 60 diff changeset	7	from builtins import *
0 ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	8	import re
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	9	import sys
29 1ebe960587b1 Read in all TLDs from a file Evgeni Kunev <evgeni.kunev@gmail.com> parents: 25 diff changeset	10	import os
0 ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	11	import subprocess
8 9cf495a1e2e9 added support for IP addresses Richard Baron Penman parents: 7 diff changeset	12	import socket
70 1fe2c20adeba Python3 support Johnny Wezel<j@wezel.name> parents: 60 diff changeset	13	from .parser import WhoisEntry
1fe2c20adeba Python3 support Johnny Wezel<j@wezel.name> parents: 60 diff changeset	14	from .whois import NICClient
0 ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	15
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	16
60 7801a420f679 added support for native client Richard Penman parents: 38 diff changeset	17	def whois(url, command=False):
0 ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	18	# clean domain to expose netloc
25 f3c0a9a442aa avoid DNS lookup of IP addresses Richard Penman parents: 23 diff changeset	19	ip_match = re.match(r"^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$", url)
f3c0a9a442aa avoid DNS lookup of IP addresses Richard Penman parents: 23 diff changeset	20	if ip_match:
f3c0a9a442aa avoid DNS lookup of IP addresses Richard Penman parents: 23 diff changeset	21	domain = url
f3c0a9a442aa avoid DNS lookup of IP addresses Richard Penman parents: 23 diff changeset	22	else:
f3c0a9a442aa avoid DNS lookup of IP addresses Richard Penman parents: 23 diff changeset	23	domain = extract_domain(url)
60 7801a420f679 added support for native client Richard Penman parents: 38 diff changeset	24	if command:
7801a420f679 added support for native client Richard Penman parents: 38 diff changeset	25	# try native whois command
7801a420f679 added support for native client Richard Penman parents: 38 diff changeset	26	r = subprocess.Popen(['whois', domain], stdout=subprocess.PIPE)
7801a420f679 added support for native client Richard Penman parents: 38 diff changeset	27	text = r.stdout.read()
33 8c4c05eb65f4 Allow explicit usage of NICClient even if whois binary is available Evgeni Kunev <evgeni.kunev@gmail.com> parents: 31 diff changeset	28	else:
60 7801a420f679 added support for native client Richard Penman parents: 38 diff changeset	29	# try builtin client
0 ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	30	nic_client = NICClient()
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	31	text = nic_client.whois_lookup(None, domain, 0)
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	32	return WhoisEntry.load(domain, text)
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	33
5 7ace7955a131 added support for japanese domains Richard Baron Penman parents: 0 diff changeset	34
0 ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	35	def extract_domain(url):
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	36	"""Extract the domain from the given URL
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	37
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	38	>>> extract_domain('http://www.google.com.au/tos.html')
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	39	'google.com.au'
60 7801a420f679 added support for native client Richard Penman parents: 38 diff changeset	40	>>> extract_domain('www.webscraping.com')
11 5083c26d8f93 added support for .pl domain Richard Baron Penman parents: 10 diff changeset	41	'webscraping.com'
22 1a6c1830d4bc added IP test cases Richard Penman parents: 14 diff changeset	42	>>> extract_domain('198.252.206.140')
8 9cf495a1e2e9 added support for IP addresses Richard Baron Penman parents: 7 diff changeset	43	'stackoverflow.com'
22 1a6c1830d4bc added IP test cases Richard Penman parents: 14 diff changeset	44	>>> extract_domain('102.112.2O7.net')
1a6c1830d4bc added IP test cases Richard Penman parents: 14 diff changeset	45	'2o7.net'
1a6c1830d4bc added IP test cases Richard Penman parents: 14 diff changeset	46	>>> extract_domain('1-0-1-1-1-0-1-1-1-1-1-1-1-.0-0-0-0-0-0-0-0-0-0-0-0-0-10-0-0-0-0-0-0-0-0-0-0-0-0-0.info')
1a6c1830d4bc added IP test cases Richard Penman parents: 14 diff changeset	47	'0-0-0-0-0-0-0-0-0-0-0-0-0-10-0-0-0-0-0-0-0-0-0-0-0-0-0.info'
0 ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	48	"""
22 1a6c1830d4bc added IP test cases Richard Penman parents: 14 diff changeset	49	if re.match(r'\d+\.\d+\.\d+\.\d+', url):
8 9cf495a1e2e9 added support for IP addresses Richard Baron Penman parents: 7 diff changeset	50	# this is an IP address
9cf495a1e2e9 added support for IP addresses Richard Baron Penman parents: 7 diff changeset	51	return socket.gethostbyaddr(url)[0]
11 5083c26d8f93 added support for .pl domain Richard Baron Penman parents: 10 diff changeset	52
31 92176112c2d6 Move tlds.txt to a data/ folder and add it to the package Evgeni Kunev <evgeni.kunev@gmail.com> parents: 29 diff changeset	53	tlds_path = os.path.join(os.getcwd(), os.path.dirname(__file__), 'data', 'tlds.txt')
29 1ebe960587b1 Read in all TLDs from a file Evgeni Kunev <evgeni.kunev@gmail.com> parents: 25 diff changeset	54	suffixes = [
1ebe960587b1 Read in all TLDs from a file Evgeni Kunev <evgeni.kunev@gmail.com> parents: 25 diff changeset	55	line.lower().strip()
1ebe960587b1 Read in all TLDs from a file Evgeni Kunev <evgeni.kunev@gmail.com> parents: 25 diff changeset	56	for line in open(tlds_path).readlines()
1ebe960587b1 Read in all TLDs from a file Evgeni Kunev <evgeni.kunev@gmail.com> parents: 25 diff changeset	57	if not line.startswith('#')
1ebe960587b1 Read in all TLDs from a file Evgeni Kunev <evgeni.kunev@gmail.com> parents: 25 diff changeset	58	]
1ebe960587b1 Read in all TLDs from a file Evgeni Kunev <evgeni.kunev@gmail.com> parents: 25 diff changeset	59
70 1fe2c20adeba Python3 support Johnny Wezel<j@wezel.name> parents: 60 diff changeset	60	if type(url) is not str:
38 da8f2956db7e Ensure lookups work with both unicode and bytes objects Evgeni Kunev <evgeni.kunev@gmail.com> parents: 35 diff changeset	61	url = url.decode('utf-8')
da8f2956db7e Ensure lookups work with both unicode and bytes objects Evgeni Kunev <evgeni.kunev@gmail.com> parents: 35 diff changeset	62	url = re.sub('^.*://', '', url.encode('idna')).split('/')[0].lower()
0 ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	63	domain = []
35 0de2468a27e8 Fix extract_domain to work with unicode domains Evgeni Kunev <evgeni.kunev@gmail.com> parents: 33 diff changeset	64
38 da8f2956db7e Ensure lookups work with both unicode and bytes objects Evgeni Kunev <evgeni.kunev@gmail.com> parents: 35 diff changeset	65	for section in url.split('.'):
0 ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	66	if section in suffixes:
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	67	domain.append(section)
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	68	else:
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	69	domain = [section]
35 0de2468a27e8 Fix extract_domain to work with unicode domains Evgeni Kunev <evgeni.kunev@gmail.com> parents: 33 diff changeset	70	return '.'.join(domain).decode('idna').encode('utf-8')
0 ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	71
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	72
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	73	if __name__ == '__main__':
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	74	try:
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	75	url = sys.argv[1]
ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	76	except IndexError:
70 1fe2c20adeba Python3 support Johnny Wezel<j@wezel.name> parents: 60 diff changeset	77	print('Usage: %s url' % sys.argv[0])
0 ea0e45971cea initial commit to mercurial Richard Baron Penman parents: diff changeset	78	else:
70 1fe2c20adeba Python3 support Johnny Wezel<j@wezel.name> parents: 60 diff changeset	79	print(whois(url))

author	Johnny Wezel<j@wezel.name>
	Sun, 07 Feb 2016 22:30:17 +0100
branch	python3
changeset 70	1fe2c20adeba
parent 60	7801a420f679
child 71	b181f795cc0d
permissions	-rw-r--r--