Neoway usa Big Data e georreferenciamento p/ colocar informações como pontos em um mapa
Física Interessante
terça-feira, 15 de dezembro de 2015
segunda-feira, 14 de dezembro de 2015
Big Data Before the Web: The "Database of Dream...
Big Data Before the Web: The "Database of Dreams"
quinta-feira, 3 de dezembro de 2015
Big Data is Crowdledge, not 3V
Meu post no LinkedIn foi divulgado como guest blog post no KDnuggets, que é um site líder em Analytics, Big Data e Ciência de Dados, com > 200K visitantes únicos mensais!
segunda-feira, 23 de novembro de 2015
Big Data, comida e ciência no Coletivo Central em Porto Alegre.
Ricardo Cappra, Big Data, comida e Ciência no Coletivo Central em Porto Alegre Como as pessoas se relacionam com a comida? O que é mais procurado na área de gastronomia? Como funciona a interação dos indivíduos com os alimentos? Estas foram algumas questões discutidas durante...
quarta-feira, 22 de outubro de 2014
Big Data em uma nuvem de tags
Encontrei esta nuvem de tags (word cloud) sobre Big Data no relatório Big Data, Big Brains da MeryTalk.
Como se pode notar, demonstra uma concentração sobre o aspecto de volume de Big Data no entendimento geral do conceito.
Apesar disso, continuo insistindo que, na minha visão, Big Data tem menos a ver com os famosos 3 V's (volume, velocidade e variedade) e mais com crowdledge, que defino como o conhecimento emergente a partir de análise Big Data de pegadas digitais espontâneas de indivíduos, tais como buscas no Google, posts no Facebook, Twitter, etc.
Como se pode notar, demonstra uma concentração sobre o aspecto de volume de Big Data no entendimento geral do conceito.
Apesar disso, continuo insistindo que, na minha visão, Big Data tem menos a ver com os famosos 3 V's (volume, velocidade e variedade) e mais com crowdledge, que defino como o conhecimento emergente a partir de análise Big Data de pegadas digitais espontâneas de indivíduos, tais como buscas no Google, posts no Facebook, Twitter, etc.
segunda-feira, 1 de setembro de 2014
É crowdledge, Big Data!
Mas, o que é isso de crowdledge?
Atualmente, o tempo todo deixamos pegadas digitais, trilhas de dados nos serviços digitais, sejam elas ativas, quando lançamos a informação pessoal deliberadamente, com a finalidade de compartilhar informações sobre nós mesmos em redes sociais, por exemplo, ou passivas, quando nossos dados são coletados por terceiros, sem qualquer atuação de nossa parte, tal como no uso do celular, câmaras de vigilância, etc.
Defino crowdledge como o conhecimento emergente e, portanto, inesperado, a partir de análise Big Data de pegadas digitais espontâneas de indivíduos, deixadas em buscas no Google, posts no Facebook, Twitter, etc. (dos SANTOS, 2014). Está implícito que esse conhecimento emerge de dados referentes a outro contexto.
Quando falo de emergente, refiro-me ao conceito introduzido por Lewes (1875), referindo-se à formação de padrões e sistemas complexos a partir de uma grande quantidade de elementos relativamente simples em interação. Conceito este que tem sido aplicado em Filosofia, Teoria de Sistemas, Ciências e Artes. Um exemplo clássico é o jogo da vida desenvolvido pelo matemático John Horton Conway, conforme a figura ao lado.
Assim, não se trata de business intelligence (inteligência empresarial) ou data mining (mineração de dados), pois não se está deliberadamente procurando extrair uma informação esperada e desejada pela administração de uma empresa, a partir de dados coletados dos clientes dessa mesma empresa.
Crowdledge não deve ser confundido com inteligência coletiva, que tem mais a ver com um processo de tomada de decisão baseada no consenso (LÉVY, 1998).
Também não deve ser confundido com wisdom of crowds (sabedoria das multidões) (dos SANTOS, 2014), que tem mais a ver com a agregação das respostas intencionais de um grande grupo de pessoas a uma dada pergunta, visando uma resposta melhor do que a melhor resposta individual (SUROWIECKI, 205).
Um exemplo de crowdledge seria o trabalho de Eagle, Macy e Claxton (2010), que conseguiram extrair dados sobre o desenvolvimento econômico de comunidades britânicas através de análise de Big Data de registros de uma rede de comunicação telefônica do Reino Unido.
EAGLE; MACY; CLAXTON, 2010. |
Referências
- dos SANTOS, Renato P. Crowdsourcing, crowdfunding e crowdledge. Palestra presentada no evento 'Refletindo as pesquisas no PPGECIM', Ulbra/PPGECIM, Canoas, RS, 14 de agosto de 2014a.
- dos SANTOS, Renato P.; LEMES, Isadora L. Aprender-com-Big-Data no Ensino de Ciências. Acta Scientiae, v. 16, n. 4, 2014b.
- EAGLE, N.; MACY, M.; CLAXTON, R. Network diversity and economic development. Science, v. 328, n. 5981, p. 1029-1031, 2010.
- LÉVY, Pierre. A Inteligência Coletiva. São Paulo: Loyola, 1998.
- LEWES, G. H. Problems of Life and Mind. First series: The foundations of a creed ... Boston and New York: Houghton Mifflin Company, 1875. v. 2
- SUROWIECKI, J. The Wisdom of Crowds. New York: Doubleday, 2005.
segunda-feira, 9 de junho de 2014
Piratas e aquecimento global?
No campo da ciência de dados, há uma velha piada sobre como a diminuição do número de piratas no mundo ao longo dos últimos 130 anos está causando o aquecimento global (HENDERSON, 2005). Já falei sobre isso anos atrás no meu site.
Este é um dos melhores exemplos de um dos erros mais comuns na lógica: confundir simultaneidade com causalidade. "Em outras palavras, assumir que, porque duas coisas estão acontecendo ao mesmo tempo, existe uma relação de causa e efeito entre elas" (ANDERSEN, 2012).
O Google Correlate, no entanto, não endossa essa correlação. Em vez disso, no site The Web Search Correlations Database, obtiveram-se sites de informação, tais como 'pacefire', 'ask.com', 'myspace.com', e 'kids.com' antes de 'emissões de dióxido de carbono', como os termos de busca mais altamente correlacionados.
Referências
Este é um dos melhores exemplos de um dos erros mais comuns na lógica: confundir simultaneidade com causalidade. "Em outras palavras, assumir que, porque duas coisas estão acontecendo ao mesmo tempo, existe uma relação de causa e efeito entre elas" (ANDERSEN, 2012).
O Google Correlate, no entanto, não endossa essa correlação. Em vez disso, no site The Web Search Correlations Database, obtiveram-se sites de informação, tais como 'pacefire', 'ask.com', 'myspace.com', e 'kids.com' antes de 'emissões de dióxido de carbono', como os termos de busca mais altamente correlacionados.
Referências
- ANDERSEN, E.. True Fact: The Lack of Pirates Is Causing Global Warming. Forbes - Blog. 23 mar. 2012. Disponível em: <http://www.forbes.com/sites/erikaandersen/2012/03/23/true-fact-the-lack-of-pirates-is-causing-global-warming/>. Acesso em: 9 jun. 2014.
- HENDERSON, B.. Open Letter To Kansas School Board. jan. 2005. Disponível em: <http://www.venganza.org/about/open-letter/>. Acesso em: 14 mar. 2009.
Marcadores:
aquecimento global,
big data,
causalidade,
correlações,
emissões de dióxido de carbono,
Google Correlate,
gráficos,
piratas,
simultaneidade
Assinar:
Postagens (Atom)