Visualización de redes sociales para obtener mejores perspectivas análisis y mapeo de relaciones sociales con la biblioteca NetworkX de Python – Parte 2.

Social network visualization for improved analysis and mapping of social relationships with Python's NetworkX library - Part 2.

Continuando con la guía para principiantes sobre cómo usar la biblioteca NetworkX de Python para realizar análisis de redes sociales

En la Parte 1, exploramos el análisis de enlaces, específicamente el análisis de redes sociales para investigar y comprender las relaciones entre individuos y entidades. Luego, presentamos el análisis de redes sociales (SNA), un tipo específico de análisis de enlaces que se centra en las personas y los grupos y sus relaciones. Revisamos los conceptos básicos de SNA, incluyendo nodos (que representan a los individuos) y bordes (que representan las conexiones entre individuos). Luego, discutimos cómo SNA se puede usar para entender la influencia social, la formación de grupos y el flujo de información utilizando métricas como la centralidad de grado y la centralidad de intermediación, utilizando a Billy Corgan y su relación con los miembros fundadores de Smashing Pumpkins como un ejemplo simple.

Imagen de Gordon Johnson de Pixabay

En ese ejemplo, mantuvimos la red pequeña y simple. En este tutorial, seguiremos usando Python y NetworkX para examinar la esfera de influencia de Billy Corgan. También expandiremos la red de Billy Corgan para hacerla más compleja y aumentar nuestra comprensión de la centralidad de grado y la centralidad de intermediación. A medida que trabajamos en este ejemplo, discutiremos el contexto y cómo el conocimiento de dominio es esencial para maximizar los beneficios del análisis de redes sociales.

Análisis de redes sociales en contexto

El conocimiento de dominio y la investigación son componentes esenciales del análisis de redes sociales porque proporcionan el contexto necesario, el marco teórico y la comprensión de los factores sociales y culturales que dan forma a las redes sociales. Sin esta comprensión, corre el riesgo de producir hallazgos engañosos o incorrectos que no capturan con precisión la complejidad y el matiz de los datos de la red social.

Antes de empezar…

  1. ¿Tienes conocimientos básicos de Python? Si no es así, comienza aquí.
  2. ¿Estás familiarizado con conceptos básicos en análisis de redes sociales, como nodos y bordes, o métricas como la centralidad? Si no es así, comienza aquí.

Recolección de datos para analizar redes sociales

Entonces, ¿qué tipo de datos necesitamos para comenzar a investigar la esfera de influencia de Billy Corgan? Comencemos con todos sus compañeros de banda de Smashing Pumpkins, actuales y antiguos.

Usando Wikipedia, podemos obtener una lista bastante confiable de todos los músicos que tocaron en Smashing Pumpkins desde 1988. Por cierto, ¿sabías que Billy Corgan (breve) tuvo otra banda llamada Zwan a principios de la década de 2000? Spoiler alert, no terminó bien. Hagamos una lista de ellos también.

Luego, abre tu IDE favorito, importa las bibliotecas relevantes y crea dos listas: una para Smashing Pumpkins y otra para Zwan.

Describir relaciones en redes sociales

Nuestra próxima tarea es crear algunas listas de tuplas para representar las relaciones entre Billy Corgan y cada uno de estos miembros de la banda. También debemos considerar la relación entre cada uno de los miembros de la banda y todos los demás miembros de la banda.

En teoría de grafos, este tipo de relación se conoce como simétrica. Si Billy está en una banda con Jimmy, Jimmy también está en una banda con Billy.

Para lograr esto, podemos usar Python para construir una función simple que ingiera cada lista de miembros de la banda y devuelva todas las posibles combinaciones de pares.

Luego, podemos aplicarlo a cada lista y combinar los resultados para crear una lista de tuplas que contengan las relaciones entre todos los miembros de la banda de Zwan y Smashing Pumpkins.

La salida se verá algo así:

[('Billy Corgan', 'James Iha'), ('Billy Corgan', 'Jimmy Chamberlin'), ('Billy Corgan', 'Katie Cole'), ('Billy Corgan', "D'arcy Wretzky"), ('Billy Corgan', 'Melissa Auf der Maur'), ('Billy Corgan', 'Ginger Pooley'), ('Billy Corgan', 'Mike Byrne'), ('Billy Corgan', 'Nicole Fiorentino'), ('James Iha', 'Jimmy Chamberlin'), ('James Iha', 'Katie Cole'), ('James Iha', "D'arcy Wretzky"), ('James Iha', 'Melissa Auf der Maur'), ('James Iha', 'Ginger Pooley'), ('James Iha', 'Mike Byrne'), ('James Iha', 'Nicole Fiorentino'), ('Jimmy Chamberlin', 'Katie Cole'), ('Jimmy Chamberlin', "D'arcy Wretzky"), ('Jimmy Chamberlin', 'Melissa Auf der Maur'), ('Jimmy Chamberlin', 'Ginger Pooley'), ('Jimmy Chamberlin', 'Mike Byrne'), ('Jimmy Chamberlin', 'Nicole Fiorentino'), ('Katie Cole', "D'arcy Wretzky"), ('Katie Cole', 'Melissa Auf der Maur'), ('Katie Cole', 'Ginger Pooley'), ('Katie Cole', 'Mike Byrne'), ('Katie Cole', 'Nicole Fiorentino'), ("D'arcy Wretzky", 'Melissa Auf der Maur'), ("D'arcy Wretzky", 'Ginger Pooley'), ("D'arcy Wretzky", 'Mike Byrne'), ("D'arcy Wretzky", 'Nicole Fiorentino'), ('Melissa Auf der Maur', 'Ginger Pooley'), ('Melissa Auf der Maur', 'Mike Byrne'), ('Melissa Auf der Maur', 'Nicole Fiorentino'), ('Ginger Pooley', 'Mike Byrne'), ('Ginger Pooley', 'Nicole Fiorentino'), ('Mike Byrne', 'Nicole Fiorentino'), ('Billy Corgan', 'Jimmy Chamberlin'), ('Billy Corgan', 'Paz Lenchantin'), ('Billy Corgan', 'David Pajo'), ('Billy Corgan', 'Matt Sweeney'), ('Jimmy Chamberlin', 'Paz Lenchantin'), ('Jimmy Chamberlin', 'David Pajo'), ('Jimmy Chamberlin', 'Matt Sweeney'), ('Paz Lenchantin', 'David Pajo'), ('Paz Lenchantin', 'Matt Sweeney'), ('David Pajo', 'Matt Sweeney')]

A continuación, podemos recorrer la lista de tuplas para generar un gráfico con NetworkX.

Lo que genera este gráfico:

Vamos a discutir dos observaciones clave que se pueden obtener sobre la red a partir de este gráfico.

  1. La esquina superior derecha donde aparecen los miembros de la banda Smashing Pumpkins es más compleja que la esquina inferior izquierda donde están los miembros de Zwan porque hay menos miembros en Zwan.
  2. Billy Corgan y Jimmy Chamberlin aparecen en el centro porque están en ambas bandas.

A continuación, consideremos cómo estas observaciones pueden reflejarse en la centralidad de grado y la centralidad de intermediación.

Centralidad de Grado y Centralidad de Intermediación con NetworkX

En la Parte 1, calculamos la centralidad de grado y la centralidad de intermediación para Billy Corgan y los miembros fundadores de Smashing Pumpkins. Para lograr esto, utilizamos dos métodos en NetworkX, y escribimos un script simple para ejecutarlos. Esta vez, como ya tenemos nuestro gráfico ensamblado, podemos simplemente ingresar el gráfico para calcular las medidas de centralidad.

Esto generará la siguiente salida:

Discutamos cómo interpretar estos resultados.

¿Qué nos dice esta tabla sobre la centralidad de grado de todos los miembros de la banda?

1. Billy Corgan tiene la puntuación de centralidad de grado más alta de 1.000, lo que indica que tiene el mayor número de conexiones o colaboraciones dentro de Smashing Pumpkins y Zwan. Está directamente conectado con todos los demás miembros de ambas bandas.

2. Jimmy Chamberlin también tiene una puntuación de centralidad de grado de 1.000, lo que sugiere que él, como Billy Corgan, tiene conexiones directas con todos los demás miembros de las dos bandas.

3. James Iha, Katie Cole, D’arcy Wretzky, Melissa Auf der Maur, Ginger Pooley, Mike Byrne, Nicole Fiorentino, Paz Lenchantin, David Pajo y Matt Sweeney tienen todos la misma puntuación de centralidad de grado de 0.727273, lo que sugiere que tienen niveles similares de conexiones o colaboraciones dentro de las bandas.

Jimmy Chamberlin, circa 2014 — swimfinfan from Chicago, CC BY-SA 2.0 < https://creativecommons.org/licenses/by-sa/2.0 >, via Wikimedia Commons

¿Qué nos dice esta tabla sobre la centralidad de intermediación de todos los miembros de la banda?

1. Billy Corgan y Jimmy Chamberlin también tienen las puntuaciones de centralidad de intermediación más altas de 0.190909, lo que indica que probablemente son intermediarios o puentes importantes entre otros miembros de la banda en términos de comunicación o colaboración.

2. Ninguno de los miembros de la banda, excepto Billy Corgan y Jimmy Chamberlin, tiene una puntuación de centralidad de intermediación no nula, lo que indica que no son centrales en términos de conectar a otros miembros.

Fortaleciendo Inferencias con Conocimiento de Dominio

Aunque las métricas de centralidad proporcionan puntos de datos a partir de los cuales se pueden hacer inferencias, estas inferencias se basan únicamente en la información proporcionada en la tabla.

Para hacer conclusiones más específicas sobre la esfera de influencia de Billy Corgan, se necesitaría conocimiento sobre la música alternativa de los años noventa y los músicos para ofrecer una hipótesis completamente desarrollada sobre la dinámica entre los miembros de estas bandas.

Así que si eres un aficionado a la música de los años noventa, déjame saber lo que piensas sobre estos resultados en los comentarios. Asegúrate de estar atento a la Parte 3, donde ampliaremos la red para explorar la centralidad de cercanía, el agrupamiento y las comunidades en el análisis de redes sociales.

Si desea obtener el script de Python completamente anotado para este tutorial, visite mi GitHub!

👩🏻‍💻 Christine Egan | Zepes | github | linkedin