Move scrapy/linkextractor.py to scrapy/linkextractors/__init__.py

2025-02-23 15:23:40 +00:00 · 2015-04-28 15:42:59 -03:00 · 2015-04-28 15:42:59 -03:00 · d72536688f
commit d72536688f
parent 896b6dd481
4 changed files with 13 additions and 7 deletions
--- a/docs/topics/link-extractors.rst
+++ b/docs/topics/link-extractors.rst
@ -78,8 +78,8 @@ LxmlLinkExtractor
    :param deny_extensions: a single value or list of strings containing
        extensions that should be ignored when extracting links.
        If not given, it will default to the
-        ``IGNORED_EXTENSIONS`` list defined in the `scrapy.linkextractor`_
-        module.
+        ``IGNORED_EXTENSIONS`` list defined in the
+        `scrapy.linkextractors`_ module.
    :type deny_extensions: list

    :param restrict_xpaths: is an XPath (or list of XPath's) which defines
@ -132,4 +132,4 @@ LxmlLinkExtractor

    :type process_value: callable

-.. _scrapy.linkextractor: https://github.com/scrapy/scrapy/blob/master/scrapy/linkextractor.py
+.. _scrapy.linkextractors: https://github.com/scrapy/scrapy/blob/master/scrapy/linkextractors/__init__.py
--- a/scrapy/linkextractors/init.py
+++ b/scrapy/linkextractors/init.py
@ -1,6 +1,9 @@
 """
-Common code and definitions used by Link extractors (located in
-scrapy.linkextractors).
+scrapy.linkextractors
+
+This package contains a collection of Link Extractors.
+
+For more info see docs/topics/link-extractors.rst
 """
 import re
 from six.moves.urllib.parse import urlparse
@ -98,3 +101,6 @@ class FilteringLinkExtractor(object):

    def _extract_links(self, *args, **kwargs):
        return self.link_extractor._extract_links(*args, **kwargs)
+
+# Top-level imports
+from .lxmlhtml import LxmlLinkExtractor as LinkExtractor
--- a/scrapy/linkextractors/lxmlhtml.py
+++ b/scrapy/linkextractors/lxmlhtml.py
@ -11,7 +11,7 @@ from scrapy.selector import Selector
 from scrapy.link import Link
 from scrapy.utils.misc import arg_to_iter
 from scrapy.utils.python import unique as unique_list, str_to_unicode
-from scrapy.linkextractor import FilteringLinkExtractor
+from scrapy.linkextractors import FilteringLinkExtractor
 from scrapy.utils.response import get_base_url


--- a/scrapy/linkextractors/sgml.py
+++ b/scrapy/linkextractors/sgml.py
@ -8,7 +8,7 @@ from sgmllib import SGMLParser
 from w3lib.url import safe_url_string
 from scrapy.selector import Selector
 from scrapy.link import Link
-from scrapy.linkextractor import FilteringLinkExtractor
+from scrapy.linkextractors import FilteringLinkExtractor
 from scrapy.utils.misc import arg_to_iter
 from scrapy.utils.python import unique as unique_list, str_to_unicode
 from scrapy.utils.response import get_base_url