Estadística para principiantes (y no tan principiantes)

El manejo de datos numéricos es clave para la investigación histórica. Ésta no podría entenderse sin ellos. De hecho, las primeras pruebas de escritura, en la Anatolia, Próximo Oriente y Mesopotamia del IV milenio AC, son recuentos de las entregas de cosechas (probablemente en forma de rentas o impuestos) y registros de propiedades. Desde entonces disponemos de multitud de datos cuantitativos provenientes de civilizaciones y culturas pasadas. Todos estos datos los podemos analizar estadísticamente para conocer mejor esas civilizaciones. Por otro lado, los y las historiadoras elaboran en el presente fuentes que también sirven para valorar estadísticamente numerosos procesos del pasado a través de los restos y testimonios que han quedado de él, tanto del periodo convencionalmente denominado histórico como del prehistórico (medidas de huesos y dientes, índices de desgaste óseo o dentario, número de restos y número mínimo de individuos, número de habitantes -absoluto, por grupos de edad, grupos de edad de muerte, sexo, origen…-, presupuestos de los estados, balanza de pagos, gastos militares, salarios, horas de trabajo, número de aprobados y suspensos… y un casi infinito etcétera).

Especialmente desde los años 60, se ha desarrollado una historia llamada cuantitativa que intenta sacar partido de este tipo de datos. Por supuesto no es la única que lo ha hecho, pues en otras tesituras y desde otros paradigmas se han hecho y hacen esfuerzos similares. En cualquier caso, lo importante aquí es ir más allá del relato, la recopilación de anécdotas, las curiosidades…, para meternos de lleno en un tipo (de entre otros posibles y válidos) de análisis de testimonios e información histórica. Habitualmente este esfuerzo se ha convertido en una búsqueda obsesiva de cientificidad, es decir, de legitimidad a través del lenguaje y herramientas matemáticos, perdiendo de vista lo que nos define como historiadores, sin adjetivos: la explicación (global, sintética, reflexiva, integradora) del pasado. Pero está claro que nos abre unas vías provechosas sin las cuales ésta sería mera narración.

Hoy vamos a ver cómo ha resultado un ejercicio de elaboración e investigación de datos estadísticos en un grupo de ESO (clase 15-A) y en otro de Bachillerato (clase 18-A2) (curso 2015-2016).

Los datos cuantitativos sistematizados constituyen fuentes históricas (tal y como las hemos definido y abordado en otras ocasiones en un sentido amplio). Por tanto, son herramientas muy válidas para estudiar el pasado. El proceso para sacarles todo su jugo, para investigarlas, suele seguir estas pautas, que son las que vamos a emplear hoy aquí.

Las fuentes históricas con datos cuantitativos están destinadas a cualquier estudiante e investigador/a de historia, sea o no profesional, aunque algunas, cuando son primarias, tienen otros destinatarios, como los funcionarios del estado o una empresa o colectividad. Suelen procesarse de diversas maneras, particularmente con herramientas propias de la estadística (cálculos absolutos, porcentuales, medias, desviación típica), de manera que se convierten en fuentes de naturaleza estadística. Estas fuentes habitualmente son de formato gráfico, o se pueden expresar gráficamente (tablas de datos, gráficos de sectores, histogramas, gráficos de puntos, lineales, de barras, campanas de Gauss…). Algunas nos han llegado, más o menos intactas, del pasado (y por tanto son de origen primario), pero la gran mayoría han sido realizadas posteriormente con datos del pasado (y son por tanto de origen secundario y de naturaleza claramente historiográfica -además de estadística). El uso que nosotros hacemos de unas y otras tiene la finalidad de la cuantificación y valoración relativa (porcentual) de datos para su mejor manejo, y cuando se presentan en formato gráfico buscamos con ellas además facilitar la expresión y comprensión de esos datos y más globalmente del tema sobre el que traten. Probad, por un lado, a abordar un tema sin datos estadísticos (los muertos en la Guerra Civil, por ejemplo) y, por otro lado, a expresarlos, en caso de que dispongáis de ellos, con un párrafo en lugar de con un gráfico. Veréis entonces la finalidad que tienen los datos estadísticos expresados gráficamente. Cuando son primarios suelen estar destinados a la contabilidad y el control por parte del estado, las empresas u otros colectivos.

El tema que vamos a tratar es el de la población del siglo XIX y principios del siglo XX. Veamos cómo se pueden construir fuentes gráficas de naturaleza estadística e historiográfica con datos cuantitativos referidas a esta etapa, y vayamos analizándolas para más adelante interpretarlas.

Los datos de los que partimos (y que luego vamos a ir ampliando) son éstos (y los hemos extraído originariamente de A. Fernández (1996): Historia universal. Edad Contemporánea. Barcelona: Vicens Vives, p. 5):

Número de habitantes (en millones), en 1800 y 1900, en Rusia (40 y 100, respectivamente), Reino Unido (16 y 41,4), Estados alemanes (23 y 56,4), Estados italianos (18 y 32,5) y España (10,5 y 18,5)

Convirtamos primero estos datos en una tabla de datos y en un gráfico, tanto a mano…

Trabajo de Gonzalo de la Cruz (15-A, curso 2015-2016)

Trabajo de Gonzalo de la Cruz (15-A, curso 2015-2016)

Como a máquina, es decir, digitalmente, y tanto de este modo…

Trabajo de Rocío Gutiérrez (15-A, curso 2015-2016)

Trabajo de Rocío Gutiérrez (15-A, curso 2015-2016)

Como de este otro:

Trabajo de Celia Royuela (15-A, curso 2015-2016)

Trabajo de Celia Royuela (15-A, curso 2015-2016)

A continuación, metámonos en el análisis de la información (como ha hecho Gonzalo en el trabajo suyo que acabamos de ver y vamos a hacer de un modo ampliado siguiendo las pautas aludida más arriba). Estas fuentes tratan un tema que podríamos denominar social, pues concierne a la población, pero al mismo tiempo tiene implicaciones económicas y políticas (e incluso culturales, si tenemos en cuenta también -para un estudio más profundo- factores referidos a la tradición como la edad de matrimonio). Podemos ver como idea fundamental que la población crece globalmente en toda nuestra muestra, aunque a ritmos diferentes (mucho mayores -en torno a un 150% en Rusia e Inglaterra- y menores -en torno a un 80% en España). (Para estos cálculos sobre la dinámica de la población -incremento en este caso- no hay más que (1) hallar la diferencia entre la magnitud de partida -40- y la final -100-, es decir, 60, (2) multiplicarla por 100 -6000- y (3) dividirla por esa magnitud de partida -40-, y nos da un incremento porcentual del 150 en el caso ruso. Y así con el resto de cifras.)

Con ello, veremos que necesitamos más datos, y con ellos más gráficos, para ampliar y concretar lo que podemos averiguar sobre el tema. Centrémonos en el caso de España a lo largo del XIX. Para empezar, confirmemos lo que hemos visto con un gráfico más específico:

Trabajo de Íñigo Montesino (18-A2, curso 2015-2016)

Trabajo de Íñigo Montesino (18-A2, curso 2015-2016)

Y seguidamente busquemos más datos para concretar el panorama. En primer lugar podemos preguntarnos cómo se produce este crecimiento. Para ello veamos las tasas de natalidad y mortalidad en el conjunto de España a finales del siglo. Podemos hacerlo de este modo…

Trabajo de Valeria Maldonado (18-A2, curso 2015-2016)

Trabajo de Valeria Maldonado (18-A2, curso 2015-2016)

O de este otro…

Trabajo de Blanca Delgado (18-A2, curso 2015-2016)

Trabajo de Blanca Delgado (18-A2, curso 2015-2016)

En cualquier caso, apreciamos que se trata de un crecimiento con elevadas tasas de natalidad y mortalidad en el arco temporal tratado (1860-1900), en torno al 35‰ en el primero y el 30‰ en el segundo. Aquí tenéis más datos, por si queréis completar el panorama en el primer tercio del siglo XX (en el que se constata una tendencia a la reducción de la mortalidad y, a un ritmo menor -que permite un crecimiento mayor, en general-, de la natalidad).

Población_s xx

En segundo lugar, podemos contrastar estas cifras con las que tenemos de una localidad de la época, Madrid, al final del periodo considerado:

Trabajo de Diego Arias (18-A2) (curso 2015-2016)

Trabajo de Diego Arias (18-A2) (curso 2015-2016)

El panorama cambia, claramente. O sea, matizamos. En términos generales, como hemos visto, tenemos un crecimiento, pero en un caso particular como Madrid (que  es una de las ciudades principales de la España del momento, con 0,5 mill. de personas) apreciamos lo contrario: tasas de natalidad muy bajas (en torno al 30‰) que incluso son superadas en ocasiones (en 1896, 1899 y 1900) por las de mortalidad.

Esto nos lleva, en tercer lugar, a buscar diferencias dentro del propio Madrid. No hay un Madrid en general (en el que no sólo no hay crecimiento, sino descenso de la población), sino barrios con importantes diferencias de riqueza y, por tanto, con distintas tasas de natalidad y de mortalidad:

Población_madrid barrios

En un barrio pobre como la Inclusa las tasas de mortalidad son el doble (ca. 40‰) que en las de uno rico, el Centro (ca. 20‰). Hay que tener en cuenta, pues, que las tasas globales de mortalidad (en este caso de una ciudad), como las que veíamos más arriba, se hacen con desviaciones o divergencias muy acentuadas. La media es 30‰, pero no es lo mismo que se componga de numerosos casos en torno a esa cifra que de otros muy dispares; bien lo sabéis vosotrxs cuando en dos evaluaciones conseguís un cinco, pero en una lo hacéis con dos cincos y en la otra con un uno y un nueve…

Para dar cuenta de esta variación respecto de la media tenemos que echar mano de una herramienta de la estadística: el “coeficiente de variación” (C.V.). Éste, en verdad, junto con todos los elementos que permiten componerlo (“varianza” y “desviación típica”), no es realmente ilustrativo a menos que dispongamos de otros correspondientes a otras series de datos (de otros barrios, de otras ciudades y de la misma u otras épocas), es decir, de una muestra (con sus subsiguientes cálculos) amplia, significativa. Es entonces cuando podemos comparar varios coeficientes y apreciar sus dimensiones. Aun así, veamos cómo funciona.

El C.V. establece la relación entre la desviación típica de una muestra y su media:

coeficiente de variación

La desviación típica (σ), por su parte, es la raíz cuadrada de la varianza:

desviación típica

Y la varianza (σ²), finalmente, es la media aritmética del cuadrado de las desviaciones respecto de la media de una muestra dada:

varianza

En el caso que nos concierne, la varianza es de 100, la desviación típica de 10 y el coeficiente de variación de 0,3. Insisto: esto no significa nada en sí mismo a menos que lo crucemos con otros datos, aunque una variación de 0,3 es relativamente elevada, especialmente contando sólo con esas dos cifras de partida. Quedémonos, pues, simplemente con que las medias deben complementarse con otros cálculos, si es posible.

Sigamos. En cuarto lugar, estudiemos las tasas de mortalidad infantil, porque no debería importarnos sólo cuántos nacen o, en este caso, mueren en general (o en función del barrio), sino qué sucede con algunos grupos de edad en particular, como es el caso de los niños:

Trabajo de Diego Arias (18-A2, curso 2015-2016)

Trabajo de Diego Arias (18-A2, curso 2015-2016)

Podemos ver que las tasas son absolutamente desproporcionadas (al menos en relación con lo que tenemos desde la segunda mitad del siglo XX). La mortalidad infantil es uno de los factores clave que inciden en los elevados índices de mortalidad que hemos apreciado en las tasas generales, ¡y de qué modo! Por otro lado, podríamos cruzar a su vez estos datos de mortalidad infantil con el factor de la clase social y estudiar en qué medida éste influye diferencialmente en aquella, es decir, cuántos niños y niñas pobres mueren frente a los niñas y niños ricos…

Dadas estas fuentes y el análisis que hemos realizado, debemos explicar e interpretar el panorama de la población de finales del siglo XIX, especialmente en España. Esta es una de las actividades más apasionantes (y complicadas) de las y los historiadores, en la que se demuestra su capacidad para dar cuenta, del modo más objetivo (completo) posible, de lo que ha sucedido y para, por consiguiente, relacionar múltiples aspectos que conocemos y que otrxs conocen, o sobre los que podemos investigar en el futuro (de modo que el estudio de unas fuentes llama, o lleva, al estudio de más fuentes, en un proceso interminable nutrido por la imaginación y la creatividad sin límites…).

Europa a lo largo del siglo XIX vive radicales transformaciones en todos los campos (político, económico, social y cultural). Algunos de los fenómenos que las provocan, o acompañan (según la relación que queramos establecer entre unas y otros), son las revoluciones liberales y nacionalistas, la expansión imperialista de las potencias europeas (y de otros continentes), la revolución industrial, el desarrollo del capitalismo, el surgimiento de la sociedad de clases, el crecimiento de las ciudades y la formación de una cultura de masas y secularizada. Todo ello nos lleva a hablar de una nueva era muy distinta a los siglos anteriores, base del mundo actual, y por eso nos referimos al inicio de la Edad Contemporánea.

En este contexto apreciamos un crecimiento generalizado de la población (a ritmos distintos, como hemos analizado) que se debe a diversos factores: los avances médicos (entre los que destaca la invención de la vacuna contra la viruela por parte de Jenner en 1795), los progresos en la higiene y la disponibilidad de agua potable (como tenemos en Madrid con la instalación del Canal de Isabel II desde 1851) y, más en general, el desarrollo fabril (desde finales del siglo XVIII, con las “indianas” privadas en Cataluña, por ejemplo) y las modificaciones de la propiedad (con los Enclosures Acts en Inglaterra a lo largo del XVIII y con las desamortizaciones en España en el marco de la construcción del estado liberal en el XIX). Globalmente (y de un modo que habría que explicar en otro momento más detalladamente) estos cambios producen una reducción de las tasas de mortalidad que permite un crecimiento exponencial de la población (sobre todo en casos como Inglaterra y Rusia), es decir, el paso de un régimen demográfico antiguo a uno moderno.

El caso particular español, sin embargo, requiere comentarios adicionales. El panorama general es, en efecto, de un incremento importante (decíamos en torno a un 80%), sobre todo desde el reinado de Isabel II (núcleo del siglo XIX), cuando el crecimiento industrial, el éxodo rural y las desamortizaciones aumentan notablemente. Estos factores se producen gracias, entre otras cosas, a importantes reformas legales (la reforma fiscal de Mon-Santillán de 1845, la Ley de ferrocarriles de 1855, la Ley de sociedades bancarias y financieras de 1856, las desamortizaciones de Mendizábal y Madoz en 1836 y 1854…). Todas son consecuencia de la toma del poder por parte de la alta burguesía (en lo que se denomina una “revolución desde arriba”) desde el final del reinado de Fernando VII (aunque ya se anunciaba desde Carlos III); con esa toma de poder se crea un marco legal propicio para el desarrollo del capitalismo. Y con él aparecen esos factores que hemos señalado como determinantes para el crecimiento demográfico: las industrias, el éxodo rural y las desamortizaciones.

Aun así, se produce bajo lo que llamamos un régimen demográfico antiguo, si bien en lenta transición a uno moderno: muchos nacimientos pero también muchas muertes (y especialmente infantiles). Y tendríamos que ver si esa lentitud es un fenómeno real o sólo un espejismo: podría haberse producido, en efecto, entre el siglo XVIII y el XIX un lento paso hacia un régimen moderno o simplemente una rápida transición a finales del XVIII seguida inmediatamente de nuevos factores que volverían a incrementar las tasas de mortalidad, como la Guerra de la independencia y las pésimas condiciones laborales de la industrialización española a lo largo del núcleo del XIX…

De cualquier forma, no es un crecimiento continuo, sino a trompicones. De hecho, en el estudio de casos concretos hemos observado que las tasas de mortalidad superan en ocasiones (como en el Madrid de fin de siglo) a las de natalidad, y un componente clave de ello es esa mortalidad infantil y los episodios de mortalidad catastrófica, en los que se produce una elevada mortalidad generalizada.

La razón no hay que buscarla, sin embargo, sólo en la dinámica demográfica. O, al menos, no podemos dejar de lado un factor crucial (ya mencionado) para explicar esta dinámica: la profunda desigualdad social intrínseca al desarrollo del capitalismo en España (y otros lugares…). Esa desigualdad implica unas pésimas condiciones de vida y de trabajo de las clases trabajadoras, tanto del campo como de la ciudad. Éstas son el caldo de cultivo de muchos de los factores que disparan los índices de mortalidad (enfermedades, como la tuberculosis, las de transmisión sexual o las derivadas de la mala calidad del agua y el alimento escaso -cólera, raquitismo…). También son las condiciones que hacen necesarias familias numerosas (con índices tan elevados de natalidad), aunque en torno a la mitad de lxs niñxs no sobreviviera… Si se compara estas condiciones con las de las clases burguesas (también aquejadas por algunas de estas dinámicas, si bien de diferente modo), queda patente esa desigualdad.

En ese sentido debemos remarcar las evidentes diferencias en las tasas de mortalidad en unos barrios y otros, y por eso debe considerarse cómo se configura el dato estadístico global sobre mortalidad: en el Madrid de finales de siglo hay una tasa de mortalidad en torno al 30‰, pero ésta se compone de importantes contrastes (ca. 20‰ en los barrios de clase media-alta y 40‰ en los de clase trabajadora y lumpen proletariado), con un coeficiente de variación del 0,3.

Y es que, según apuntan múltiples estudios (como los citados por A. Fernández en su manual, referidos a la Revolución industrial en Gran Bretaña), el desarrollo del capitalismo necesitó de la miseria y explotación constantes de las clases trabajadoras, y en numerosos lugares sigue siendo así, bajo la forma decimonónica o mediante formas renovadas y menos evidentes… El estudio histórico del Madrid de finales del siglo XIX y principios del XX, en el que se ambientan algunas de las grandes novelas de Baroja (como las de la trilogía de La lucha por la vida), aportaría pruebas clarísimas de este aspecto, como mostró en su momento Carmen del Moral en su famoso estudio sobre El Madrid de Baroja.

Por supuesto, deben tomarse en consideración otras causas para explicar la realidad demográfica que hemos observado en la España de finales del siglo XIX: las políticas de salud pública, la falta de legislación laboral, el analfabetismo, la inexistencia de medios anticonceptivos… El estudio de cada una de ellas nos llevaría a proseguir y profundizar en esta investigación.

Finalmente hay que señalar que la situación demográfica irá evolucionando hacia una reducción de las tasas tanto de mortalidad como de natalidad, a raíz de las luchas sociales (de las clases trabajadoras y de las medianas y pequeñas burguesías), el fortalecimiento del poder del estado, las mejoras médicas…, especialmente desde los gobiernos liberales y conservadores que abanderan el revisionismo (la versión política del regeneracionismo) en la primera parte del reinado de Alfonso XIII, con Maura y Canalejas, y sobre todo durante la II República, durante los gobiernos de Azaña. Claramente, este proceso tiene sus idas y venidas, pero eso ya es otra historia…

Globalmente, debemos valorar estas fuentes positivamente, pues permiten probar la dinámica demográfica básica de fines del XIX. Ahora bien, hemos tenido que ir ampliando las fuentes manejadas para ir completando el panorama; nunca nos servirá una única fuente, sino que será preciso cotejar unas con otras y ampliar cada vez más (aunque progresivamente) el arco considerado. En la discusión y el contraste de múltiples fuentes está el camino que nos conduce a una historia más completa.

***

Agradecimientos:

Por supuesto, a todxs lxs alumnxs que han colaborado en esta entrada (Gonzalo, Celia, Rocío, Íñigo, Valeria, Blanca y Diego), pero también a la profesora de Matemáticas para las Ciencias Sociales Laura González, por su ayuda técnica en las fórmulas y operaciones estadísticas. Ojalá algunxs de nosotrxs hubiésemos tenido una profa de mates como ella en su momento…

***

Fuentes:

Fontana, J. (1992): La historia después del fin de la historia. Reflexiones acerca de a situación actual de la ciencia histórica. Barcelona: Crítica. 153 pags.

Moral, Carmen del (2001): El Madrid de Baroja. Madrd: Sílex.

Spar, Ira. “The Origins of Writing.” In Heilbrunn Timeline of Art History. New York: The Metropolitan Museum of Art, 2000–. http://www.metmuseum.org/toah/hd/wrtg/hd_wrtg.htm (October 2004)

http://www.vitutor.com/estadistica/descriptiva/estadistica.html

Anuncios