Home // Posts tagged "statistics" (Page 3)

Loterias Pseudoaleatórias?

Os geradores de números pseudoaleatórios foram desenvolvidos por décadas de pesquisa por computólogos e físicos (não tenho certeza que matemáticos tenham entrado nessa), ver aqui, aqui e aqui. No caso dos físicos, um dos objetivos era simular modelos em física estatística. E agora estão usando isso para a Loteria da Nota Fiscal Paulista! Quem disse que a ciência básica não tem aplicações? Será que isso foi bancado pela FAPESP?

A distinção entre um evento puramente aleatório e um pseudoaleatório muitas vezes não pode ser feita. Ou seja, dado uma sequência de números, eu posso testá-la e e eventualmente mostrar que é pseudoaleatória. Mas eu não posso provar que ela é de origem puramente aleatória. Acho essa assimetria filosoficamente intrigante: provar que uma sequência é aleatória se torna uma questão metafísica ou mesmo metamatemática. E agora que percebi isso, até me animei para me inscrever no programa da Nota Fiscal Paulista…

Sorteio eletrônico

6/1/2009

Agência FAPESP – Técnicos do Centro de Tecnologia da Informação, Automação e Mobilidade do Instituto de Pesquisas Tecnológicas (IPT) desenvolveram o software e a metodologia para o sorteio eletrônico da Nota Fiscal Paulista, programa da Secretaria da Fazenda de incentivo à exigência de documento fiscal em estabelecimentos comerciais.

O primeiro sorteio mensal do programa foi realizado em dezembro e premiou um milhão de bilhetes de consumidores. Em janeiro, serão R$ 12 milhões em prêmios, que variam de R$ 10 a R$ 50 mil.

Segundo o IPT, a confiabilidade do sorteio é garantida pelo software de acordo com a geração de números aleatórios que não são previsíveis. Para isso foi utilizado o algoritmo de criptografia AES (Advanced Encryption Standard, na sigla em inglês), recomendado pelo Instituto de Padrões e Tecnologia dos Estados Unidos. Trata-se de uma fórmula matemática, com valor inicial de 16 dígitos, designada para gerar um milhão de combinações numéricas de 0 a 9, que representam os bilhetes sorteados.

Os quatro últimos dígitos dos quatro primeiros prêmios da Loteria Estadual Paulista compõem o valor inicial de 16 dígitos, chamado de “semente”. Ao digitar esses 16 números no programa, gera-se um milhão de combinações e o processo como um todo dura apenas 19 segundos. Com o total de bilhetes participantes, a “semente” e o número de prêmios possibilitam conferir na tela do computador o resultado do sorteio.

O Programa Nota Fiscal Paulista devolve 30% do Imposto sobre Circulação de Mercadorias e Serviços (ICMS) efetivamente recolhido pelo estabelecimento a seus consumidores. Os consumidores que informarem o CPF ou CNPJ no momento da compra escolhem como receber os créditos e ainda concorrem a prêmios em dinheiro.

Mais informações sobre o programa: www.fazenda.sp.gov.br

79 olhos por um olho, 15 dentes por um dente


Achei essa frase curiosa de um professor israelense:

“Poucas pessoas morreram em Israel nos anos recentes vitimadas pelos foguetes do Hamas, cerca de dez, enquanto mais de 4.000 morreram em acidentes de carro. Acho mais perigoso dirigir até Tel Aviv de que ser atingido por um desses foguetes.”

Fonte Portal G1: Foguetes do Hamas são desculpa política para invasão, diz professor israelense

Imortalidade

A ser lido, talvez seja útil no paper sobre Paradoxo de Fermi. Ver também este paper de Landis sobre Percolação e Paradoxo de Fermi.

Survival Strategies

Authors: David A. Eubanks

(Submitted on 3 Dec 2008)

Abstract: This paper addresses the theoretical conditions necessary for some subject of study to survive forever. A probabilistic analysis leads to some prerequisite conditions for preserving, say, electronic data indefinitely into the future. The general analysis would also apply to a species, a civilization, or any subject of study, as long as there is a definition of “survival” available. A distinction emerges between two approaches to longevity: being many or being smart. Natural selection relies on the first method, whereas a civilization, individual, or other singular subject must rely on the latter. A computational model of survival incorporates the idea of Kolmogorov-type complexity for both strategies to illustrate the role of data analysis and information processing that may be required. The survival-through-intelligence strategy has problems when the subject can self-modify, which is illustrated with a link to Turing’s Halting Problem. The paper concludes with comments on the Fermi Paradox.

Comments: 12 pages
Subjects: Populations and Evolution (q-bio.PE); Quantitative Methods (q-bio.QM)
Cite as: arXiv:0812.0644v1 [q-bio.PE]

Cuidado com o Café!


Para os estudantes pensarem:

1. Porque as mulheres da amostra não podem estar tomando anticoncepcionais?

2. Apenas cerca de 150 mulheres tinham a mutação. Se X% delas tomam mais de duas xícaras de café, qual é o verdadeiro tamanho da amostra que está sendo pesquisada?

Do Yahoo Notícias:

Segundo o site da ‘BBC Brasil’, o consumo de café em excesso pode provocar uma diminuição no tamanho dos seios de algumas mulheres, afirma um estudo na Suécia. Tal diminuição ocorre por conta de uma variação genética que atinge, aproximadamente, metade das mulheres entre as que tomam três ou mais xícaras de café por dia e não usam pílulas anticoncepcionais.

A pesquisa foi publicada na revista científica ‘British Journal of Cancer’, onde pode-se ler que a mutação genética seria a responsável pela relação entre o consumo de café e o tamanho dos seios por afetar os hormônios femininos.

Uma das explicações oferecidas pelos cientistas é de que o café contém estrogênios que afetariam diretamente o funcionamento dos hormônios das mulheres, causando um impacto no tamanho dos seios.

Para a coordenadora do estudo, Helena Jernstrom, da Universidade de Lund, na Suécia, “beber café pode ter um impacto grande no tamanho dos seios”. No entanto, os pesquisadores alertam que as mulheres que bebem café não precisam se preocupar porque a diminuição não é repentina e não fará com que os seios percam todo o volume.

Como foi feita a pesquisa

Os pesquisadores analisaram 300 mulheres que não tomavam pílulas anticoncepcionais e não tinham histórico de câncer. Entre elas, 50% possuíam a variante genética. Durante dez anos, estas mulheres responderam questionários periódicos sobre consumo de café, uso de contraceptivos e hábitos como o fumo, por exemplo.

Além disso, os pesquisadores mediram os níveis hormonais e o tamanho dos seios das mulheres. Os seios foram medidos como se fossem pirâmides – multiplicando o tamanho da base e das laterais para indicar o volume.

Ao final da pesquisa, os cientistas puderam notar que as mulheres que tinham a variação genética e tomavam uma quantidade moderada ou alta de café (pelo menos três xícaras por dia) apresentaram uma diminuição no tamanho dos seus seios.

PS: Pelo jeito, Laura Croft não toma café!

Conselhos humorísticos para jovens cientistas



How long should an astronomical paper be to increase its Impact?

Krzysztof Zbigniew Stanek
(Submitted on 3 Sep 2008)

Naively, one would expect longer papers to have larger impact (i.e., to be cited more). I tested this expectation by selecting all (~30,000) refereed papers from A&A, AJ, ApJ and MNRAS published between 2000 and 2004. These particular years were chosen so papers analyzed would not be too “fresh”, but at the same time length of each article could be obtained via ADS. I find that indeed longer papers published in these four major astronomy journals are on average cited more, with a median number of citations increasing from 6 for articles 2-3 pages long to about 50 for articles ~50 pages long. I do however observe a significant “Letters effect”, i.e. ApJ and A&A articles 4 pages long are cited more than articles 5-10 pages long. Also, the very few longest (>80 pages) papers are actually cited less than somewhat shorter papers. For individual journals, median citations per paper increase from 11 for ~9,300 A&A papers to 14 for ~5,300 MNRAS papers, 16 for ~2,550 AJ papers, and 20 for ~12,850 ApJ papers (including ApJ Letters and Supplement). I conclude with some semi-humorous career advice, directed especially at first-year graduate students.

Comments: 11 pages, 5 figures
Subjects: Astrophysics (astro-ph); Digital Libraries (cs.DL); Physics and Society (physics.soc-ph)
Cite as: arXiv:0809.0692v1 [astro-ph]

Google Trends

O Google Trends (acima) compara o volume de busca de palavras chave com o volume de notícias referentes às mesmas. É curioso a diferença entre as curvas no caso de Clinton (azul) e Obama (vermelho). Já o Blog Pulse parece fornecer uma série temporal bem mais detalhada. A pensar…

Pesquisa Interdisciplinar e Avaliação

INFORMAÇÕES GERAIS
Local: Auditório do Centro de Convenções da UNICAMP
Data: 8 de maio de 2008
Horário: 8h45 às 17h
Informações adicionais: Claudia Pfeiffer – mailto:[email protected]
Inscrições Gratuitas: http://www.cori.unicamp.br/foruns/tecno/foruns_tecno.php

SOBRE O EVENTO
Instrumentos de pesquisa bibliográfica, criados originalmente como ferramenta de pesquisa em algumas áreas do conhecimento a partir dos anos 50 do século passado, passaram a ser utilizados como indicadores e, portanto, subsídio para avaliações. Esse uso cada vez mais difundido precisa de uma discussão, também difundida em função das diferentes ênfases dos bancos de dados e práticas de divulgação nas comunidades das distintas áreas do conhecimento. Num contexto de crescente interdisciplinaridade, essa problemática torna-se ainda mais complexa. Nesse evento, pretende-se abordar a questão com os distintos olhares acadêmicos envolvidos e necessários para uma avaliação e diagnóstico da pesquisa interdisciplinar.

PROGRAMA
MANHÃ:
8h45 – Abertura
9h00 – Introdução: “Avaliação, indicadores, perfis e disciplinas” Peter A. Schulz – IFGW/Cocen – Unicamp
10h00 – Pausa para Café
10h15 – Palestra e Discussão: “Indicadores da Produção Científica Brasileira: Um Olhar Através das Diversidades” Rogério Mugnaini – Centro Latino-Americano e do Caribe de Informação em Ciências da Saúde
11h15 – Palestra e Discussão: “É Possível Comparar Pesquisadores com Interesses Científicos Diferentes?” Osame Kinouchi Filho – USP – Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto
12h15 – Pausa para Almoço
TARDE:
14h00 – Palestra e Discussão: “A Encruzilhada Interdisciplinar: Avaliações e Rupturas” Denise Correa Rocha Lannes – UFRJ
15h00 – Pausa para Café
15h15 – Mesa Redonda (Participação de todos os palestrantes)
“Interdisciplinaridade: Um Caminho Para Uma Avaliação Mais Abrangente?” Mediadora: Silvia Regina Turcinelli – CBMEG- Unicamp
17h00 – Encerramento

ORGANIZADORES:
COCEN – Coordenadoria de Centros e Núcleos Interdisciplinares de Pesquisa

Avaliação e Interdisciplinariedade

Fui convidado para participar do fórum “Avaliação e Interdisciplinariedade” na UNICAMP, dia 08 de maio agora, para falar sobre o tema: É possível comparar pesquisadores com interesses científicos diferentes? A questão de avaliação quando estão envolvidos múltiplas dimensões realmente é complicada. Sempre gostariamos de ter um índice, um número, para realizar comparações.

Imagino que o problema central é encontrar as dimensões relevantes e examinar os vetores multidimensionais, fazer clusterização etc. O problema, acho eu, é que as dimensões realmente relevantes seriam os eixos componentes principais (por exemplo, de uma análise PCA), mas os mesmos, por serem combinações de outros, não possuem interpretação clara a priori.

Não conseguimos também visualizar esses espaços multidimensionais. Uma tentativa é usar um gráfico tipo estrela como abaixo (retirado do artigo interessante O Índice DNA Brasil: sistema múltiplo de indicadores por Geraldo Di Giovanni, Pedro Luiz Barros Silva, Norberto Dachs e Geraldo Biasoto Jr. )

apostas

Um estudo realizado por cientistas americanos sugere que imagens sensuais podem afetar o comportamento dos homens nas decisões financeiras e fazer com que eles arrisquem mais dinheiro.
De acordo com o estudo da Universidade de Stanford, nos Estados Unidos, publicado na edição desta semana da revista científica NeuroReport, as imagens sensuais estimulam a atividade no núcleo accumbens- área do cérebro responsável pela sensação de prazer e recompensa.
A pesquisa indica que a estimulação desta área afeta as decisões financeiras tomadas pelos homens imediatamente após serem estimulados visualmente com as imagens sensuais e eróticas.
Estímulo
Para estabelecer os resultados, os cientistas submeteram um grupo de estudantes universitários heterossexuais a exames de ressonância magnética para verificar a atividade do cérebro quando eram expostos a três grupos de imagens, cada um correspondente a um tipo de estímulo visual.
O primeiro grupo, utilizado para criar estímulos positivos, continha imagens de mulheres sensuais e cenas eróticas, enquanto o grupo feito para criar estímulos negativos era composto por imagens de cobras e aranhas. Os cientistas incluíram também imagens como objetos de papelaria – como grampeadores, réguas, etc – relacionados a estímulos considerados “neutros”.
Como parte da pesquisa, logo após serem expostos a cada uma das imagens, os voluntários tinham que fazer uma aposta. O montante variava entre US$ 0,10 e US$ 10. Depois de comparar a quantia apostada por cada voluntário e a imagem que estimulou a aposta, os cientistas verificaram que o estímulo visual positivo influenciou os homens a fazerem apostas mais altas.
“A descoberta mais interessante, do ponto de vista econômico, é que estes estímulos positivos, apesar de não estarem relacionados diretamente com a aposta, influenciam o comportamento na hora de arriscar o dinheiro”, disse Brian Knutson, que liderou a pesquisa.
De acordo com o estudo, os resultados ajudam a esclarecer quais os apelos emocionais e visuais podem ser eficazes em diversas áreas como publicidade, política e nos jogos de sorte.
“Em um cassino, por exemplo, as pessoas usam roupas sensuais, há luzes, música, bebidas alcoólicas e outros estímulos que não estão necessariamente relacionados com as apostas. Mas estas são pistas que podem encorajar os riscos financeiros e fazer com que as pessoas gastem mais”, explicou Knutson.
O cientista ressaltou ainda que há muita pesquisa a ser feita para decifrar os efeitos do estímulo visual no comportamento. Segundo ele, o próximo passo do estudo será analisar o comportamento das mulheres quando estimuladas visualmente.

Problema desafio

Vou oferecer um livro aqui (e colaboração num paper).

Para um dado (ou cubo) com densidade uniforme, a probabilidade de sair uma face é 1/6. Agora considere um paralelepípedo com lados a x a x b. Temos dois tipos de faces, uma com área A= a^2 e uma com área B = ab. Será possivel calcular a partir de primeiros princípios qual a probabilidade de ocorrência de cada tipo de face?

Para ter idéia da função P(B) em função da razão b/a basta fazer um experimento, ou seja, ir variando essa razão em um paralelepípedo de densidade uniforme e fazer a estatística correspondente da frequência relativa de ocorrência das faces. Alguém se dispõe a fazer isso? Acho que este problema vale um Stanislaw Lem: “His Master Voice” é uma boa pedida…

Obviamente, se for possível realizar o cálculo, então deve ser fácil generalizar o problema para três faces diferentes, densidade não uniforme em um cubo etc. Não sei não, calcular resultados estocásticos a partir de mecânica newtoniana me parece algo muito difícil. Esse problema me cheira um PRL.

Fitando Leis de Potência

Cosma Shalizi, do Three-Toed Sloat, me enviou um paper de sua autoria com Mark Newman e Aaron Clauset. Alunos de IC, por favor leiam o paper. Talvez valesse a pena marcarmos um journal club sobre ele.

Power-law Distributions in Empirical Data

This page is a companion for the review article on power-law distributions in empirical data, written by Aaron Clauset (me), Cosma R. Shalizi and M.E.J. Newman. The intention is that this page will host implementations of the methods we describe in the article. For now, these are simply the versions we wrote (in Matlab and R), but our hope is to eventually host versions in a variety of languages. In general, we want to make the methods as accessible to the community as possible.Journal Reference: A. Clauset, C.R. Shalizi, and M.E.J. Newman, “Power-law distributions in empirical data” E-print (2007). arXiv:0706.1062

Perceptron – 51 anos de uma boa idéia!

Embora Frank Rosemblatt tenha publicado um report em 1957, o primeiro artigo sobre o Perceptron publicado em revistas científicas é de 1958, ou seja, exatamente há 50 anos. Para comemorar essa data, vou contar nos próximos posts algo sobre o Perceptron.

Este site de livros raros onde encontrei o exemplar do Psychologial Review de 1958 é interessante.

Da Wikipédia, a conferir mais tarde:

More recently, interest in the perceptron learning algorithm has increased again after Freund and Schapire (1998) presented a voted formulation of the original algorithm (attaining large margin) and suggested that one can apply the kernel trick to it. The kernel-perceptron not only can handle nonlinearly separable data but can also go beyond vectors and classify instances having a relational representation (e.g. trees, graphs or sequences).

Freund, Y. and Schapire, R. E. 1998. Large margin classification using the perceptron algorithm. In Proceedings of the 11th Annual Conference on Computational Learning Theory (COLT’ 98). ACM Press.

Deu na Folha também…

Mas só pra quem é assinante. Mas depois do embargo de algumas horas, Marcelo Leite colocou em seu blog do UOL, o Ciência em Dia. Observação: o paper foi submetido agora ao New Journal of Physics e, se não der, será submetido ao Evolution and Human Behavior, que anda publicando coisas sobre evolução e culinária (veja próximo post).

São Paulo, domingo, 23 de março de 2008

MARCELO LEITE – A evolução do ovo – A evolução culinária se parece com a dos genes

No cardápio do almoço de Páscoa que se avizinha, existe mais de uma chance entre dez de se encontrar ovo. Não só o de chocolate, certeza e delícia ainda maior, mas também o substancial produto do esforço da galinha. Pode estar na farofa, ou na massa da macarronada. Ou, mais provável, na sobremesa. Nem mesmo a mania nutricionalmente correta de excomungar tudo que tenha colesterol foi capaz de banir essa maravilha de uma enorme quantidade de receitas. Se você acha que isso nada tem a ver com ciência, enganou-se. Esta coluna não muda de assunto, ou o faz só raramente. E, assim como não resiste a chocolate, tampouco deixaria de deliciar-se com um artigo científico que começa assim: “Comida é uma parte essencial da civilização”.

O artigo “A Natureza de Não-Equilíbrio da Evolução Culinária” foi recusado pelo editor do periódico “Physical Review E”, que o considerou um estudo de antropologia cultural, não de física. Dois de seus autores, porém, são físicos (Osame Kinouchi e Antônio Carlos Roque, ambos da USP de Ribeirão Preto). O texto pode ser localizado na internet (arxiv.org/ftp/arxiv/papers/0802/0802.4393.pdf.) Durante um jantar, eles e Rosa Garcia, nutricionista da mesma universidade, debatiam um assunto matemático trivial -redes complexas. Entre uma garfada e outra, surgiu a hipótese de que ingredientes e receitas culinárias guardem entre si o tipo de conexão estatística que caracteriza essas redes. Para testar a hipótese, o trio não se dirigiu a um laboratório, a “cozinha repugnante” de que fala Bruno Latour, onde se refogam conceitos com ninharias. Foram buscar seus dados nos livros. Mais precisamente: três edições do clássico “Dona Benta” (dos anos 1946, 1969 e 2004), um “Larousse Gastronomique”, um “New Penguin Cookery Book” e até o medieval “Pleyn Delit”. O passo seguinte foi laborioso: anotar à mão 3.394 ingredientes mencionados em 7.702 receitas. Em seguida, eles foram classificados num ranking de freqüência (em quantas receitas eram listados) para cada livro. Já com a ajuda de um especialista em informática (Adriano Holanda) e de outro físico (Pedro Zambianchi), iniciaram a busca por equações que descrevessem as freqüências relativas.

Acabaram descobrindo curvas de distribuição, similares entre todas as obras, que obedeciam às chamadas leis de potência. Noves fora, concluíram que um ingrediente na posição r do ranking é 2,6 vezes (2 elevado a -1,4) mais freqüente que outro na posição 2r. Um exemplo: na edição de 2004 do “Dona Benta”, o ovo é o oitavo ingrediente mais comum, aparecendo em 412 receitas; já o caldo de limão, na 16ª posição (r=8; 2r=16), comparece em 186 delas. Bem, 412 dividido por 186 dá 2,2, e não os 2,6 da lei de potência encontrada. Para corrigir distorções como essa, os gourmets de Ribeirão enriqueceram a receita com uma pitada de “aptidão” (“fitness”) para cada ingrediente, um valor entre 0 e 1 que poderia representar muitas coisas a influenciar sua posição no ranking -como a facilidade de encontrá-lo na feira.

Kinouchi e equipe mostraram mais que uma curiosidade matemática: a evolução culinária se parece muito com a de genes. Observa-se, por exemplo, o dito “efeito fundador”. Um ingrediente comum nas primeiras receitas de um povo tende a permanecer em sua culinária por longo tempo, mesmo após intensa miscigenação. Assim como os brasileiros continuarão morenos por gerações a fio, vários de seus futuros quitutes também levarão ovos.
MARCELO LEITE é autor de “Promessas do Genoma” (Editora da Unesp, 2007) e de “Brasil, Paisagens Naturais – Espaço, Sociedade e Biodiversidade nos Grandes Biomas Brasileiros” (Editora Ática, 2007). Blog: Ciência em Dia ( www.cienciaemdia.zip.net ). E-mail: [email protected]

Para os meus alunos de IC

News and Views


Nature Physics 2, 75 – 76 (2006) doi:10.1038/nphys228

Subject Category: Statistical physics, thermodynamics and nonlinear dynamics

Complex networks: Lies, damned lies and statistics

Luis A. Nunes Amaral1 and Roger Guimera1

  1. Luis A. Nunes Amaral and Roger Guimera are in the Department of Chemical and Biological Engineering and Northwestern Institute on Complex Systems, Northwestern University, Evanston, Illinois 60208, USA. e-mail: [email protected]; e-mail: [email protected]

Abstract

Statistical physics can reveal the fabric of complex networks, for example, potential oligarchies formed by its best-connected members. But care has to be taken to avoid jumping to conclusions.


Introduction

Old boys networks, fraternities, free-mason shops — many of us look at them with suspicion. The worry about the dangers of oligarchies is not new. Adam Smith1 noted that “people of the same trade seldom meet together, even for merriment and diversion, but the conversation ends in a conspiracy against the public, or in some contrivance to raise prices.” However, do the powerful indeed purposefully organize into such ‘rich-club’ structures or do the connections we observe arise merely as a natural consequence of a stochastic process — if you have many connections, you are quite likely to connect ‘by chance’ to another well-connected member of the community. On page 110 of this issue, Colizza and colleagues2 tackle the intricate problem of quantifying the existence of systematically created oligarchies within networks, and apply their findings to cases from many different areas. Surprisingly, they find that the Internet, which had been reported to display an oligarchic structure3, in fact does not.

At its core, the question that Colizza et al.2 address is no different from the problem of deciding if, for example, someone who is 6 foot 5 inches — or 196 cm — is tall or not. Obviously, the question only makes sense if one defines the group of people with whom the person in question is being compared. A height of 196 cm is significantly larger than the height of the average adult female, but it is significantly smaller than the height of the average centre player in the US national basketball association (NBA). The challenge clearly is in identifying the appropriate group for making the comparison. An NBA scout will not decide if a prospect is tall enough to play centre by comparing his height to the heights of the general population. In the same spirit, Colizza and her co-workers demonstrate that the first measure3 introduced to quantify the presence of oligarchies in complex networks is prone to misinterpretation: it will take increasing values as the number of connections of the nodes in the network increases. Thus, an oligarchy will always appear to be present, even if the network is random.

This shortcoming, which casts doubt on the conclusions that can be drawn from such an analysis, can be circumvented. Colizza et al. show that the value of the so-called rich-club coefficient needs to be compared with its expected value for a random network whose nodes have the exact same number of connections as the network one is interested in. In other words, an appropriate null model has to be found for comparison. Colizza and colleagues have now found the correct null model for the rich-club coefficient and, when applied to real networks, it reveals some surprises; they uncover that the Internet does not have an oligarchic structure whereas, for example, scientific collaborations do. That is, a social network, such as the one created by the scientific collaborations among researchers displays a markedly rich-club structure. This tells us that our worries about oligarchies within social systems are not unwarranted. The ultra-rich and powerful do not congregate at the Davos meetings by pure chance. On the other hand, rather unexpectedly, local hubs in the Internet, while providing rich connectivity to other nodes, are not tightly interconnected among themselves.

The importance of the findings reported by Colizza et al. is not restricted to the detection of oligarchies in networks. They demonstrate that — to prove the saying “there are three kinds of lies: lies, damned lies, and statistics” wrong — appropriate null models are needed to provide a suitable normalization before drawing conclusions from absolute measurements. Indeed, similar considerations apply to the analysis of one of the most important (and intensively studied) properties of complex networks — their modular structure4, 5. Most real networks are organized into modules; think, for example, of groups of friends or collaborators within social networks, or of pathways within the metabolism. The relevant questions are: Can we determine whether a network has a significantly modular structure? Is modularity enhanced during the formation and evolution of a particular network? As happens when attempting to uncover the presence of a rich-club oligarchy, one needs to be careful and compare any measured values to the appropriate null model. Even within completely random networks, sub-graphs exist that are much denser than the graph as a whole. But these denser regions arise entirely due to fluctuations, that is, due to chance4.

At a more general level, the significance of reported observations on the global properties of complex networks, such as ‘scale-free’ (that is, power-law) distributions of the number of links per node, must be taken with care6. Consider the metabolic network5 in Fig. 1a. The overall degree distribution of the network is relatively well approximated by a power law. However, different modules have quite distinct degree distributions. For comparison, a ‘randomized’ version of the same network, although displaying the same overall degree distribution, lacks modular structure. In fact, a plausible explanation for the structure and emergence of modules may have to do with attaining specific goals7 rather than with preferential attachment8.

Figure 1: Cautionary tale for network analysis.

Figure 1 : Cautionary tale for network analysis.

a, In the metabolic network of Escherichia coli, each node represents a metabolite and two metabolites are connected if there is a biochemical reaction that transforms one into the other. Different colours represent different modules5. b, Randomization of the same network. Even though the degree distributions of the two networks are identical, they have quite different structural properties. For example, the metabolic network is modular whereas its randomization is not.

Full size image (42 KB)

Methods developed in the framework of statistical physics provide a powerful tool to analyse the organization of complex networks, and can reveal similar organization principles for networks from such dissimilar areas as biology, technology or social sciences. But surely, great care has to be taken to put the analysis on solid statistical grounds. Otherwise, our analysis will only tell us what we want to hear.

BlogPulse indica que Obama ganha de Clinton?

Talvez… Bom, na última eleição, BlogPulse tinha esse padrão na relação Lula-Alckmin.
No caso do Technorati temos o mesmo padrão (na verdade, Obama recebe atenção duas vezes maior…)

Posts that contain Barack Obama per day for the last 30 days.
Technorati Chart
Get your own chart!

Posts that contain Hillary Clinton per day for the last 30 days.
Technorati Chart
Get your own chart!

Estatística sem matemática?

Mapa da febre amarela no Brasil

Febre Amarela
O que é?
Qual o microrganismo envolvido?
Quais os sintomas?
Como se transmite?
Como tratar?
Como se prevenir?
Situação da Febre Amarela no Mundo
Situação da Febre Amarela no Brasil

Mahalanobis

Mulheres que deixam religião têm mais risco de alcoolismo, diz pesquisa


01/01/2008 – 14h34

da BBC Brasil, via Folha Online:

Mulheres que abandonam suas atividades religiosas têm três vezes mais chances de sofrer de ansiedade, depressão e alcoolismo, segundo um estudo conduzido por pesquisadores norte-americanos.

Os especialistas, da Universidade de Temple, na Filadélfia, analisaram 718 adultos e concluíram que entre as mulheres que haviam deixado de freqüentar a igreja, 21% apresentaram sintomas de ansiedade, depressão e problemas relacionados ao excesso de bebidas alcoólicas.

O mesmo, no entanto, não foi observado entre os homens. O trabalho, publicado na revista especializada “Social Psychiatry and Psychiatric Epidemiology”, apontou que os homens que deixaram de praticar sua fé tinham menos chances de sofrer de depressão do que os que compareciam à igreja regularmente.

Para a coordenadora do estudo, Joanna Maselko, as mulheres sofrem mais ao se afastarem da religião porque também têm mais chances de perder amigos e se afastar da “rede social da igreja”.

“As mulheres são normalmente mais integradas às redes sociais de suas comunidades religiosas. Quando deixam de ir à igreja, perdem o acesso a esta rede e todos seus benefícios potenciais”, observa Maselko.

Já os homens, afirma Maselko, “não parecem ser tão integrados à comunidade religiosa, portanto não sofrem com as possíveis conseqüências se abandonam a igreja”.

Para a coordenadora do trabalho, é possível “ter um melhor entendimento da relação entre saúde e espiritualidade quando conhece a história religiosa de uma pessoa”.

Mais algumas pesquisas para as minhas turmas de Estatística:

Tequila diminui risco de câncer, dizem cientistas mexicanos

Medicamento para epiléptico ajuda no tratamento contra alcoolismo

Estudantes que não dormem têm notas piores, diz estudo

14/12/2007 – 18h54

da Folha Online

Os alunos que nunca ficam estudando à noite toda têm notas ligeiramente maiores do que aqueles que optam por perder noites inteiras para estudar, diz um estudo norte-americano divulgado nesta sexta-feira.
Uma pesquisa com 120 estudantes na St. Lawrence University, em Nova York, revelou que os estudantes que nunca passavam noites em claro estudando tinham nota média 3,2. Já os que optavam por perder noites de sono para estudar tiveram nota 2,95.
O estudo será publicado em janeiro na revista “Behavioral Sleep Medicine”.
“Não é uma grande diferença, mas chama a atenção”, afirmou Pamela Thacher, professora-assistente da universidade e autora do estudo. “Eu estudo principalmente a questão do sono e sei que ninguém consegue pensar de forma clara às 4 da manhã. Você acha que sim, mas não consegue”, diz.
Um segundo estudo feito por Thacher mostra resultados “bastante similares”, com notas mais baixas entre os estudantes que deixam de dormir.
Howard Weiss, um médico do St. Peter’s Sleep Center, em Albany, afirma que os resultados do estudo fazem sentido.
“Certamente os dados mostram que um período curto de sono interfere na concentração, no desempenho e em testes objetivos”, disse ele.
No primeiro estudo de Thacher, 65 alunos afirmaram que passaram mais de uma noite toda sem dormir para estudar e 45 disseram que nunca haviam feito isso. A pesquisa foi feita com alunos de diversos cursos.

Leia mais
Estudo identifica “gatilho” que aciona relógio biológico
Cérebro gerecia memória como o computador, diz estudo
Privação do sono realça experiências negativas, diz estudo
Cientistas descobrem mecanismo de perda de memória em ratos

Da Wikipedia:

[edit] Dream content
From the 1940s to 1985, Calvin S. Hall collected more than 50,000 dream reports at Western Reserve University. In 1966 Hall and Van De Castle published The content analysis of dreams in which they outlined a coding system to study 1,000 dream reports from college students.[26] It was found that people all over the world dream of mostly the same things. Hall’s complete dream reports became publicly available in the mid-1990s by Hall’s protégé William Domhoff allowing further different annylisis.

[edit] Emotions
The most common emotion experienced in dreams is anxiety. Negative emotions are more common than positive feelings.[26] Some ethnic groups like the Yir Yoront showed an abnormally high percentage of dreams of an aggressive nature. The U.S. ranks the highest amongst industrialized nations for aggression in dreams with 50 percent of U.S. males reporting aggression in dreams, compared to 32 percent for Dutch men.[26]

[edit] Gender differences
It is believed that in men’s dreams an average of 70 percent of the characters are other men, while a female’s dreams contain an equal number of men and women.[27] Men generally had more aggressive feelings in their dreams than women, and children’s dreams did not have very much aggression until they reached teen age. These findings parallel much of the current research on gender and gender role comparisons in aggressive behavior. Rather than showing a complementary or compensatory aggressive style, this study supports the view that there is a continuity between our conscious and unconscious styles and personalities.

[edit] Sexual content
The Hall data analysis shows that sexual dreams show up no more than 10 percent of the time and are more prevalent in young to mid teens[26]. Another study showed that 8% of men’s and women’s dreams have sexual content[28].

[edit] Recurring dreams
While the content of most dreams is dreamt only once, many people experience recurring dreams—that is, the same dream narrative is experienced over different occasions of sleep. Up to 70% of females and 65% of males report recurrent dreams.[29]

[edit] Common themes
Content-analysis studies scientists have identified common reported themes in dreams. These include: situations relating to school, being chased, running slowly/inplace, sexual experiences, falling, arriving too late, a person now alive being dead, teeth falling out, flying, embarrassing moments, failing an examination, or a car accident. Twelve percent of people dream only in black and white.[30]