Você confiaria Google para decidir o que é verdade eo que não é?

Eu moro na Flórida Central. Este lugar tem uma estranha mistura de residentes muito conservadoras e muito liberais, o que significa que as conversas em reuniões sociais pode degenerar em retórica partidária incrivelmente rapidamente. Eu não sou um fã de partidos, políticos ou sociais.

A natureza controversa de fatos

Aqui está o que os proprietários de Android fazer quando a Apple lança um novo iPhone; garantia da Apple para o iPhone resistente à água 7 não cobre danos líquido; $ 400 smartphones chineses? Apple e Samsung livrar-se rivais baratos, aumentar os preços de qualquer maneira;? DeepMind do Google afirma marco importante em máquinas de fazer falar como os humanos

Se você separar os seus próprios preconceitos, assistindo pessoas jorra suas opiniões sobre o que eles consideram fatos concretos pode provar ser esclarecedor (se incomodar).

A única menção de que o presidente, dentro de um curto espaço de tempo, levar a uma discussão sobre se ele nasceu no Havaí ou no Quênia. Um comentário sobre o bom tempo que estamos tendo vontade, dentro de minutos, levar a um desacordo sobre se estamos experimentando o aquecimento global, as alterações climáticas ou nada. A menção de uma visita do médico irá degenerar em uma acalorada discussão sobre os méritos ou perigos de vacinas. E assim por diante.

É como vivemos em universos paralelos, onde os fatos que são “verdade” para um grupo que vive em um universo paralelo são completamente diferentes dos fatos que são “verdade” para outro grupo vivendo em um universo paralelo alternativo.

Francamente, estou convencido de todos os meus vizinhos (e quase todo mundo na Flórida) é uma loucura, mas isso é apenas o meu sistema de representação pessoal para lidar com a vida em um local habitado por indivíduos com opiniões fortes.

Os fatos são mutáveis. Para um cientista como eu, mesmo fazer essa declaração faz com que minha dor alma, mas se você se reúnem em uma sala cheia de Floridians (ou outros grupos de americanos controversas), o truthiness de que a declaração logo se torna evidente.

A ciência tem maneiras de provar ou não informações para criar um corpo de conhecimento que chamamos de “fato”. Muitas pessoas, no entanto, são completamente imune à realidade como observado pela ciência.

Toda esta discussão é politicamente preocupante. Por exemplo, se eu fosse dizer “a racionalmente pessoas que pensam,” o pessoal de ciência-minded seria auto-identificar. Mas assim que a multidão birther, a multidão o aquecimento anti-global, e até mesmo os anti-vaccers.

Por um lado, alguns de nós podem olhar os outros de nós e considerá-los full-ganso bozo. Certamente que parece ser o caso com os anti-vaccers, que parecem determinados por algum motivo para trazer o vírus do sarampo de volta dos mortos.

Mas aqui é a coisa. Enquanto a ciência médica nos Estados Unidos é muito capaz, também sabemos que não podemos confiar plenamente a comunidade médica. Relatório após relatório nos mostra histórias de ganância, corrupção e erros cometidos por médicos, seguradoras, hospitais.

Também não podemos confiar plenamente quaisquer declarações sobre “fato” feito pelo nosso governo, porque a maioria são declarações cuidadosamente elaborada criados por spin doctors destinadas a apoiar uma agenda ou de outra.

O ponto é que, enquanto você e eu poderia concordar com alguns fatos, e enquanto alguns de nós podem ver esses fatos como indiscutíveis grandes corpos de outras pessoas, não vai. Na verdade, enquanto um grupo de nós podem pensar que um outro grupo acredita ser loucura, o inverso também é frequentemente verdadeiro.

Eu trago esta longa discussão sobre os fatos por causa de um trabalho de pesquisa muito interessante do Google, “Baseada no Conhecimento Trust: Estimando a confiabilidade das fontes da web” (PDF).

Nele, o Google pesquisadores Xin Luna Dong, Evgeniy Gabrilovich, Kevin Murphy, Van Dang, Wilko Horn, Camillo Lugaresi, Shaohua Sun, e Wei Zhang discutir as diferenças de valor entre exógenos e endógenos sinais ao classificar as páginas da Web.

? Inovação; mercado M2M salta para trás no Brasil; Impressão 3D; impressão mãos 3D em: Trabalhando com madeira; Banking; parceiros CommBank com Barclays para pagamentos móveis, a inovação FinTech; Inovação; Victoria visa campo dos sonhos para o talento tecnologia local?

Google tem usado por muito tempo sinais exógenos para determinar o ranking da página. meios exógenos “relacionados a fatores externos”, e como todos sabemos, o Google tem usado por muito tempo as ligações de ligações recebidas de outras páginas da Web para determinar page rank.

Existem, naturalmente, falhas com esta abordagem. Em primeiro lugar, embora o Google fez o seu melhor, a indústria SEO inteira existe para tentar ao jogo dos sinais que aumentam page rank. Em segundo lugar, enquanto o Google dá primazia a páginas populares, não levantar páginas menos conhecidas que podem, na verdade, contêm uma melhor informação, de melhor qualidade.

Esta equipe de pesquisadores do Google está tentando melhorar tudo isso. Eles estão usando Vault Conhecimento do Google, outra tecnologia experimental – neste caso, uma base de conhecimento de milhares de milhões de dados recolhidos automaticamente a partir de páginas da Web em torno da Internet (PDF paywall).

A idéia por trás do projeto Confiança baseada no conhecimento é estabelecer uma classificação de confiabilidade para páginas da Web individuais com base – e não em popularidade – mas na factualness real da informação apresentada. Esta classificação confiabilidade seria outro sinal alimentado em sistema de ranking do Google para determinar quais as páginas que apresentam maior nos resultados da pesquisa.

Esta é uma idéia poderosa com um grande potencial. Ao invés de desenvolvedores da Web manipulando o sistema com esquemas de SEO desarrumado, páginas contendo informação boa, sólida seria elevada nos rankings de busca, fornecendo pesquisadores com informações muito mais útil e correto.

Ele também tem o potencial de reduzir a natureza eco-câmara da Web, onde se pós popular é pego e repetido várias vezes, até que a Internet como um todo considera o que quer que o pós originalmente disse ser verdade, embora ninguém pode na verdade, citar a fonte originária de qualquer afirmação está sendo apresentado.

Há, obviamente, problemas óbvios – especialmente onde a crença intersecta fato. Vamos tomar como exemplo os pesquisadores usaram bravamente: país de nascimento do presidente Obama. Embora não haja provas contundentes de que o presidente nasceu nos Estados Unidos, ainda existem aqueles lá fora que acreditam que ele nasceu no Quênia. O próprio presidente, não é particularmente útil, até mesmo usou a história do Quênia como o punchline de uma piada no Gridiron Club.

Em seu estudo, os pesquisadores do Google ponderada páginas que contenham falsidades (como o Quénia como local de nascimento de Obama) como inferior em termos de confiabilidade em comparação com as páginas que contêm fatos. Isto serviria para levantar essas páginas com maior precisão em nossos resultados de pesquisa sobre aqueles que continha falsidades, fatos que o Vault Conhecimento considerada incorreta.

Claro, existem algumas questões muito sérias com esta abordagem. A primeira e mais óbvia é que nem todo mundo acredita que os mesmos fatos – e para alguns tópicos (como religião, política, e se há alguma razão ainda marginalmente justificável para baunilha de existir quando temos chocolate), não há realmente nenhuma maneira de fazer uma caso todos vão aceitar.

A segunda preocupação é o artigo que eu link acima em OnPolitics. Esse artigo apresentou um relatório sobre o discurso do presidente do Gridiron Club, mas afirmou que o presidente brincou sobre Quênia como seu local de nascimento. Porque esta página contém um facto que o Vault Conhecimento considerado errado, ele seria empurrado para baixo nos resultados, mas é realmente interessante, porque o próprio presidente era o único riffing no fato incorreto. Não há nenhuma garantia de que um resultado de pesquisa baseada em fatos iria entender e fator para essa nuance.

Aqui está outro exemplo. Vamos dizer que, como um escritor, eu estou escrevendo um artigo sobre os factóides equivocadas sobre a qual os negadores da mudança climática estão baseando suas crenças. Eu preciso ser capaz de pesquisa para que as informações e não tem Google, pensando que está me fazendo um favor, apenas artigos de superfície que acha que são mais precisos. Sua busca de precisão pode ser diretamente em conflito com os objetivos da minha pesquisa, simplesmente porque, mais uma vez, não compreendem a nuance ou fundamentação da pesquisa que eu poderia estar empreendendo.

Portanto, a questão é saber se a maioria das pessoas em todos os grupos socioeconômicos e educacionais confiaria Google para servir páginas da Web com base na sua interpretação algorítmica dos fatos. Falando como um cientista da computação com um grau avançado, eu sou mais propensos a confiar em Google, porque meu fundo e educação é muito semelhante a muitos no Google. Muitos estudos têm mostrado que as pessoas com formações semelhantes tendem a compartilhar os sistemas de crenças, pelo menos, algum grau.

Mas eu não sou representante de toda a América. E mais ao ponto, o que acontece se o próprio Google começa a mostrar uma agenda nos fatos vem à tona? Este é grande coisa, porque, como sabemos, os sistemas escolares foram indo para a batalha há anos sobre se a evolução é ensinada nas escolas, juntamente com o criacionismo. Enquanto eu acredito firmemente na evolução, apoiada pelo forte e (a maioria dos cientistas) evidência científica indiscutível, ainda há um monte de americanos que discordaria.

Nos aprofundarmos em que a Internet das coisas vai ter o maior impacto eo que isso significa para o futuro de grandes análise de dados.

Não há dúvida de que o Google tem um poder tremendo em termos do que lemos e encontrar quando estamos à procura de respostas. Mas há um componente orwelliano potencialmente perigosa para o Google utilizando a sua interpretação da verdade de peso páginas da Web, ou é um método brilhante que irá melhorar a qualidade do resultado da pesquisa para todos nós?

Eu também questionar se esta é uma batalha Google quer entrar. Uma vez que os americanos começam lutando por sistemas de crenças, toda a aparência de racionalidade e fair play parece ir pelo caminho. Se o Google começa a entregar resultados de pesquisa com base na sua determinação da verdade, ele vai encontrar-se no meio de uma guerra santa?

próprios pesquisadores do Google reconhece que seu trabalho tem um longo caminho a percorrer antes de estar pronto para o horário nobre. Encorajo-os a continuar o trabalho, porque melhores resultados de busca beneficiar a todos nós. Mas eu também incentivá-los a ter em mente os eventuais conflitos sobre sistemas de crenças e explorar como pode ser necessário para pesar ambos os fatos e crenças amplamente mantidas e de alguma forma equilibrar os dois.

Afinal de contas, um motor de busca não é uma ferramenta para determinar a verdade. É uma ferramenta para descobrir o que uma grande variedade de pessoas estão dizendo, alguns dos quais podem ser verdade, alguns dos quais podem ser completamente nutso-bozo, mas tudo isso é a Web. Nós pesquisadores precisam ver tanto o que poderíamos concordar e que podemos não gostar. É um grande, maravilhoso, mundo louco lá fora, e devemos ser capazes de chafurdar em toda ela, a fim de encontrar as verdades pessoais todos e cada um de nós procura.

? Mercado M2M salta para trás no Brasil

3D imprimir as mãos em: Trabalhando com madeira

? Parceiros CommBank com Barclays para pagamentos móveis, inovação FinTech

Victoria visa campo dos sonhos para o talento tecnologia locais

Confiança Baseada no Conhecimento do Google

A Web como câmara de eco

Os riscos de uma autoridade central de fatos