[MÚSICA] Salve, salve. Vamos falar agora sobre modularidade, o meu assunto favorito no campo das redes ecológicas. [MÚSICA] Eu quero apresentar para você esse conceito de modularidade no contexto das redes ecológicas. [MÚSICA] Vamos lembrar daquela outra aula, que eu falava para você de redes sociais e como é que a nossa vida é dividida panelinhas, o grupo da escola, o grupo da academia, o grupo do boteco. Na Natureza, a gente observa a mesma estrutura, por exemplo, se a gente pensar nas relações entre polinizadores e plantas, elas também acabam sendo estruturadas guildas, grupos funcionais e outros tipos de subgrupos definidos pela teoria ecológica. O mais legal do conceito de modularidade é que a gente pode usar como forma de operacionalizar esses conceitos ecológicos. E há vários tipos de subgrupos redes. A gente pode chamar o subgrupo de comunidade, lembrando que isso é o jargão de grafos, não o jargão de ecologia. É comunidade no sentido de subgrupo. Eu dei uma pincelada para vocês sobre alguns dos conceitos que a gente usa, só que agora é hora de focar nos módulos. O primeiro passo é desenhar de uma forma mais adequada, mais eficiente. Esse tipo de desenho, do grafo bipartido, apesar de ser muito comum na literatura ecológica, ele é muito pouco útil. Na verdade, ele é bom só para você checar o aninhamento da rede. Se você quiser estudar modularidade use desenhos de minimização de energia como camada kauai, fruta mandrágora e outras. Assim fica muito mais fácil entender os subgrupos, os módulos da rede e além disso, estudar também a centralidade dos vértices, mas isso a gente vai falar depois, outra aula. O que é que é módulo então? O módulo é uma panelinha, uma bolha da nossa rede, da rede social ou de uma rede de polinização, de uma rede biogeográfica também, rede espacial, rede social. Como é que a gente pode conceituar módulo? Ele é uma comunidade de vértices que tem maior probabilidade de se conectar entre si do que com outros vértices da mesma rede. Vamos pensar na modularidade, essa história da conexão dentro e fora do módulo. Existem dezenas de conceitos, métricas e algoritmos. Conceito é a parte teórica, é o conceito teórico da coisa, métrica é a matemática que você usa para operacionalizar esse conceito, e os algoritmos são receitas de bolo computacionais que você usa para otimizar o cálculo da métrica. Pode calcular a modularidade redes binárias ou ponderadas, unipartidas ou bipartidas, monocamada ou multicamada e você pode focar nos vértices ou até nas arestas da rede. Tem conceito métrico e algoritmo para tudo quanto é caso. Uma coisa importante de perceber é que a mioria desses conceitos vem dos trabalhos de Girvan e Newman 2002 e Newman de 2006. Ou seja, a maior parte dos trabalhos sobre modularidade bebe nessas duas fontes. Então, eu recomendo fortemente que se você gostar do assunto da modularidade, lê esses trabalhos seminais. Vamos pensar num exemplo didático. Será que essa rede tem comunidades? Olhando aqui para a estrutura do grafo, dá para perceber que deve ter aí pelo menos umas duas comunidades. Como é que a gente começa a olhar isso? A gente pode começar identificando motifs ou motivos nessa rede, nesse grafo. O motivo mais simples que existe é a tríade ou triângulo, que a gente já viu naquela aula da Teoria de grafos. É o tamanho mínimo que clique deve ter. Repara que esses vértices vermelho estão maximamente conectados entre si, então, eles são triângulo ou uma tríade. A gente pode olhar também motivos maiores, como por exemplo, o clique máximo. além daqueles três vértices, se a gente olhar os cinco desse pedacinho da rede, a gente vê que eles também estão maximamente conectados. então eles formam clique. Tudo bem. Quando você consegue identificar facilmente cliques, é tranquilo você perceber esses subgrupos, essas comunidades da sua rede. Mas e se a comunidade não fosse maximamente conectada? E se a gente tirasse duas arestas desse grafo, só dessa parte do grafo? Aí não dá para falar clique mais, pelo menos naquele clique máximo de cinco vértices. Nesse caso, a gente precisa de conceitos menos restritivos para identificar as comunidades da rede. Aí o que entra é o conceito de módulo, é conceito mais sofisticado e menos restritivo. Usando algoritmos de modularidade a gente pode perceber por exemplo, que tem módulo azul nessa rede e que também tem módulo amarelo nela. Para a gente entender onde é que começa e onde é que termina cada módulo, a gente precisa olhar para as conexões dentro e fora do módulo. Eu pintei de vermelho as conexões que ocorrem fora de qualquer desses dois módulos. Estão percebendo como é que é a estrutura desse grafo aqui? Vamos dar uma olhada nesse vértice. Ele tem grau dentro do módulo, ou seja, grau interno igual a três. e grau externo, ou seja, conexões fora do módulo igual a. A gente já começa a perceber, ele tem uma maior probabilidade de se conectar aos vértices desse módulo azul do que a outros vértices da rede, e o mesmo vale para os outros vértices azuis. Então isso faz com que eles componham o módulo. Beleza. E olha que legal. Esse conceito de modularidade é tão útil que dá até para usar no contexto de centralidade, ou seja, da importância relativa dos vértices de uma rede. Está vendo esse vértice que eu marquei a roxo? Ele é vértice que liga comunidades. Então ele tem alta centralidade. Depois a gente vai entrar detalhe sobre isso outra aula. Mas fica com isso na cabeça. Tem vértices que não pertencem direito a nenhum módulo, mas eles ligam módulos diferentes. E isso faz com que eles tenham alta importância. Igual a esse outro vértice aqui marcado a roxo também. Lembra que aqui o outro vértice ligava a comunidade, só que esse outro vértice roxo domina módulo. Então, ele também tem alta centralidade por ser uma autoridade local. Depois a gente volta nos detalhes sobre isso. Como é que ficam os módulos numa rede real? Vamos pensar agora nisso na natureza. Vamos lembrar daquele exemplo da relação entre formigas e plantas mirmecófitas, que é uma relação muito íntima, muito estreita, que depende de muitas adaptações mútuas. Por isso ela forma uma rede bem vazia. Na verdade, é uma rede representada por grafo desconectado, que tem componente gigante e três componentes menores. Daí a gente fala, 'identifiquei quatro comunidades nessa rede, posso parar por aqui'. Mas olha só, depois de usar esse conceito mais estrito do componente você pode olhar de novo, por exemplo, para aquele componente gigante da rede e perceber que dentro dele tem comunidades mais subtis, que são módulos. Então, dá para você começar por exemplo, numa rede muito grande, identificando qual é o componente gigante dela. Aí você descarta os componentes menores, foca no componente gigante e começa a estudar a estrutura de módulos dentro dele. E esse é procedimento muito comum que a gente faz quando está tentando entender a modularidade de alguns sistemas. Dá para você combinar conceitos estritos com conceitos mais relaxados, mais soltos também. E no caso daquela rede formada por formigas e plantas com nectários extraflorais? Uma relação muito menos íntima, bem mais solta, bem mais fácil de acontecer na natureza. Lembra, é uma rede muito densa com uma conectância muito alta, formada por apenas componente, onde não pode chamar de gigante porque só tem ele. Qualquer conceito métrico ou algoritmo de modularidade que você usar aqui vai ficar confuso e você vai perceber que é difícil entender uma estrutura de módulos numa rede tão densa quanto essa. Na verdade, quando a rede é densa demais nem faz muito sentido falar de subgrupos, não é uma ideia, não é uma família de conceitos que te ajude a entender bem essa estrutura. E se a gente pensar outro exemplo, relações entre flores que produzem óleo e abelhas que colectam óleo? Olha como é que fica uma rede disso. Dá para perceber que tem módulos. Tem por exemplo o módulo verde relativamente bem resolvido. acho que todo o mundo concorda que aquilo forma módulo, só que, por outro lado, tem módulos como esse azul que são muito sobrepostos com outros. Quando você começa a perceber que os módulos não estão totalmente bem separados uns dos outros vocês se perguntam, por exemplo, no caso desse vértice aqui marcado, a qual módulo ele pertence? Será que ele pertence mesmo àquele azul claro? Ou ele deveria estar no verde, ou ele deveria estar no azul escuro? Está vendo? Tem uma certa ambiguidade. Para você poder tomar uma decisão de a qual módulo aquele vértice pertence você precisa, às vezes, fazer dendrograma, você precisa estudar a heterogeneidade ou a dissimilaridade de composição de módulos entre os vértices da rede e aí estabelecer linhas de corte onde você fala: 'a partir desse grau de dissimilaridade eu considero módulo ou não'. Está vendo então, que quando você trabalha com modularidade a composição de módulos da sua rede não é uma história de sim ou não, ela tem gradientes, tem graus. E tem várias métricas para lidar com diferentes tipos de sistema. Há dezenas de métricas e cada uma delas tem uma eficiência diferente para desemaranhar esses módulos de redes reais. Você tem métodos ainda que são estáticos, baseados só na estrutura da rede e métodos dinâmicos, que se baseiam na construção da rede ou processos ou por exemplo, hipercolação na rede ou caminhadas aleatórias. Você pode ter métodos que fazem cortes absolutos dos módulos ou métodos que permitem sobreposição, permitem uma certa heterogeneidade na composição. Você pode ter métodos também que tentam fazer uma otimização do resultado. O método não só calcula uma modularidade e pronto, ele fica calculando várias vezes até achar o resultado que tem menor entropia. Na hora de você escolher uma métrica para fazer o seu trabalho, você tem que pensar nas características da sua rede. Mas só para deixar uma dica aqui para você, a métrica favorita de todas as áreas da ciência é a métrica Louvain, porque é uma métrica que você pode usar até para desemaranhar módulos redes gigantes com milhões de vértices. Na ecologia, a mais popular até ao momento é a métrica M talvez por que ela começou a ser usada por pioneiros nos anos 2000 e pegou, virou moda. Só que tem uma versão adaptada dela, chamada métrica Q que foi proposta mais para o contexto de redes menores, que são mais comuns de a gente estudar na ecologia, não aquelas redes gigantes como redes bioquímicas ou redes computacionais. Mais recentemente foi proposta uma outra métrica, a DIRTLPAwb+ que é uma métrica muito adequada para redes bipartidas e ponderadas, que é o tipo de rede que a gente mais estuda no contexto de redes ecológicas, especialmente redes de interações. E é uma métrica boa para redes pequenas que é a nossa realidade na maioria dos casos ecologia. [MÚSICA] Quais são as mensagens principais? Qual a moral da história? Lembre-se, módulos são uma forma sofisticada de estudar comunidades redes. Módulos ajudam a entender centralidade. Na verdade, muitas métricas e conceitos de centralidade dependem de que primeiro você identifique a estrutura de módulos da rede para depois falar da importância relativa de cada vértice. Conceitos levam a métricas e essas métricas são otimizadas por algoritmos de cálculo. A maioria das métricas se baseiam no M de Girvan e Newman. Escolha uma métrica adequada com base nas características da sua rede. É importante você ter mente que não existe uma métrica que serve para todos os casos, então, é importante ler essa literatura a fundo. [MÚSICA]