Linux
   Home  |  Notícias  |  Artigos  |  Dúvidas  |  Anuncie  | Comunidades |  Parceiros  |  Contato
Login
Facebook  Twitter
Login


Artigos - Internet

Publicado em 20/09/2011 16:09:34



joao

Nesta rápida dica criaremos um simples Perl script para recuperar o PageRank de um site através de linha de comando.


Descobrindo o PageRank de um site via linha de comando

 

Para quem não sabe o que é PageRank, eis um trecho de sua definição na Wikipédia:

O sistema PageRank é usado pelo motor de busca Google para ajudar a determinar a relevância ou importância de uma página. Foi desenvolvida pelos fundadores do Google, Larry Page e Sergey Brin enquanto cursavam a Universidade de Stanford em 1998.

O Google mantém uma lista de bilhões de páginas em ordem de importância, isto é, cada página tem sua importância na Internet como um todo; esse Banco de Páginas mantém desde a página mais importante do mundo até a menos importante. Essa importância se dá pelo número de votos que uma página recebe. Um voto é um link em qualquer lugar da Internet para aquela página. Votos de páginas mais importantes valem mais do que votos de páginas menos importantes.

Fonte: http://pt.wikipedia.org/wiki/PageRank

Para executar nosso script será necessário a instalação do módulo Perl WWW:Google::PageRank. Vamos instalá-lo via CPAN:

$ sudo perl -MCPAN -e shell

Na shell interativa comande:

cpan[1]> install WWW::Google::PageRank
cpan[1]> exit

De volta ao terminal, vamos verificar se a instalação do módulo foi executada com sucesso:

$ perl -MWWW::Google::PageRank -e 'print "ok "'

A saída deve ser um simples "ok".

Agora vamos ao script em si. Abra um editor de texto de sua preferência e crie um arquivo com o seguinte conteúdo:


 

#!/usr/bin/perl

use WWW::Google::PageRank;
my $pr = WWW::Google::PageRank->new;

foreach my $site (@ARGV) {
   if ( $site !~ /^http/i ) { $site = "http://$site"; }
   print "$site tem pagerank " . scalar($pr->get($site)) . " ";
}


Salve com um nome qualquer, aqui adotei pagerank.pl.

Dê permissão de execução:

$ chmod a+x pagerank.pl

E finalmente execute-o, passando a lista dos sites desejados como parâmetro:

$ ./pagerank.pl www.vivaolinux.com.br

http://www.vivaolinux.com.br tem pagerank 6

 

Outro exemplo:

$ pagerank.pl www.vivaolinux.com.br br-linux.org www.doode.com.br under-linux.org dicas-l.com.br softwarelivre.org www.noticiaslinux.com.br

 

http://www.vivaolinux.com.br tem pagerank 6
http://br-linux.org tem pagerank 6
http://www.doode.com.br tem pagerank 5
http://under-linux.org tem pagerank 6
http://dicas-l.com.br tem pagerank 7
http://softwarelivre.org tem pagerank 7
http://www.noticiaslinux.com.br tem pagerank 6

É isso.

Fonte: http://www.vivaolinux.com.br/dica/Descobrindo-o-PageRank-de-um-site-via-linha-de-comando


Seja o primeiro a fazer um comentario.




    Logar-se


Links Patrocinados

iCloudWeb - Otimizando Negócios

Impofácil

Bugroon Raízes

Untitled Document

 

Copyright © 2019 SoumaisLinux.com.br . Conteúdo distribuido sob licença GNU FDL