RobotFileParser Class
A classe RobotFileParser fornece vários métodos para leitura, análise e resposta a perguntas sobre os robôs.arquivo txt em um determinado recurso.
Os métodos suportados incluem:
Exemplo de uso de uso
O código a seguir mostra o uso da classe RobotFileParser e os métodos fornecidos.
importar urllib.RobotParser
rp = urllib.RobotParser.RobotFileParser ()
rp.set_url ("https: // linuxhint.com/robôs.TXT")
rp.ler()
req_rate = rp.request_rate ("*")
req_rate.segundos
rp.crawl_delay ("*")
rp.can_fetch ("*", "https: // linuxhint.com/assinando-se-linuxhint-com/")
rp.can_fetch ("*", "https: // linuxhint.com/assinando-se-linuxhint-com/wp-admin ")
O código acima começa importando o módulo RobotParser e criando uma instância da classe RobotFileParser.
Então passamos o URL para os robôs.arquivo txt e envie o arquivo para o analisador. Em seguida, usamos os métodos fornecidos para executar várias ações.
O código acima deve retornar:
5
30
Verdadeiro
Falso
Conclusão
Neste artigo, discutimos como usar o módulo RobotParser do pacote urllib, permitindo que você execute várias ações, conforme fornecido nos robôs.arquivo txt. Sinta -se à vontade para explorar o código -fonte para obter mais informações.