Las restricciones de privacidad de Trump podrían reducir los datos de la Oficina del Censo: NPR


La nueva orden de la administración Trump prohíbe a la Oficina del Censo y a la Oficina de Análisis Económico utilizar “ruido” estadístico o datos para nublar los resultados de las encuestas, para proteger la privacidad de las personas en sus estadísticas.

Antón Petrus/Getty Images


ocultar título

cambiar subtítulos

Antón Petrus/Getty Images

Un cambio de política involuntario por parte de la administración Trump puede significar el fin de una gran cantidad de datos de la Oficina del Censo, incluidas estadísticas clave utilizadas para la redistribución de distritos, la formulación de políticas y la investigación.

La ley federal exige que la oficina mantenga el anonimato de las personas en los datos generados a partir de encuestas y registros gubernamentales.

Pero este mes, la administración emitió una orden que, según muchos expertos en datos, hará difícil, si no imposible, que la agencia equilibre la protección de la confidencialidad de la información pública con la publicación de datos útiles sobre áreas locales y poblaciones pequeñas.

La orden del Departamento de Comercio, que supervisa la oficina, prohíbe la “infusión de ruido”. Esta es una de las técnicas clave de protección de la privacidad que la oficina ha utilizado durante décadas para hacer que ciertos datos sean anónimos, para garantizar que los individuos, incluidos los miembros de comunidades minoritarias, no puedan ser identificados.

En contraste, la nueva política de la administración Trump, que también se aplica a la Oficina de Análisis Económico, les da a ambas agencias estadísticas dos opciones: publicar estadísticas «aproximadas» con menos detalles o no publicar algunas estadísticas en absoluto.

Los expertos en datos temen que esto pueda ser lo último que suceda en la Oficina del Censo.

«Los datos a nivel de vecindario están en riesgo. Es posible que los datos de las comunidades rurales no se hagan públicos», dijo Beth Jarosz, investigadora principal del Massive Data Institute de la Universidad de Georgetown y vicepresidenta de la Asociación de Usuarios de Datos Públicos. «Hay algunos condados que sólo tienen unos pocos cientos de habitantes y es posible que ya no se puedan publicar datos para esos condados».

John Abowd, ex científico jefe de la Oficina del Censo que sirvió durante las primeras administraciones de Trump y Biden, dijo que la orden cambia el sistema de protección de la privacidad para varias encuestas en curso y otros conjuntos de datos.

Para el recuento anual por el que la oficina es más conocida, la agencia no agregó ningún dato estadístico a los resultados del censo estatal de 2020 utilizados para redistribuir los escaños del Congreso y los votos del Colegio Electoral.

Pero la oficina ha implementado métodos de protección de la privacidad que implican la manipulación de datos demográficos detallados utilizados para volver a dibujar mapas de distritos electorales individuales.

Abowd dijo que bajo la prohibición del ruido estadístico impuesta por la administración Trump, los planes para la redistribución de distritos en el censo de 2030 «tendrán que ser completamente rediseñados, y no solo cubrir la confidencialidad».

«La única protección de la confidencialidad disponible es la tosquedad. Se garantiza que esto reducirá drásticamente el nivel de detalle», añadió Abowd.

Cuando se le preguntó si algunos cartógrafos políticos podrían considerar inutilizables esos datos de redistribución de distritos, Abowd respondió: «Estoy bastante seguro de que la mayoría pensaría que sí».

La oficina de información pública de la oficina no respondió a la solicitud de comentarios de NPR. En un comunicado, la portavoz del Departamento de Comercio, Kristen Eicamer, dijo que la orden prioriza medidas duras como técnica de protección de la privacidad preferida para «mantener la confianza pública en nuestros datos y al mismo tiempo cumplir con nuestro deber de salvaguardar la privacidad de quienes proporcionan información».

Eicamer también afirmó que «el uso indiscriminado de infusión de ruido, aunque no lo exige la ley, en última instancia socavó la confianza en el producto del departamento y arrojó dudas sobre su integridad». Cuando NPR le preguntó sobre ejemplos específicos de dicho uso, Eicamer no respondió.

La orden del departamento podría levantarse antes del censo de 2030, bajo una nueva administración presidencial.

Pero los observadores del censo están preocupados por el impacto a largo plazo del cambio de política que se produce en medio de preparativos cruciales para el próximo recuento nacional y poco después de que la experiencia de la oficina se redujera en medio de recortes a la fuerza laboral federal por parte de la administración Trump.

Y algunos miembros del personal actual expresaron preocupaciones sobre la propuesta.

«No es exagerado decir que esto es un gran desastre», dijo un empleado de la oficina que pidió a NPR que no los nombrara porque no estaban autorizados a hablar con la prensa. «Desde nuestra perspectiva actual, si esta política sigue vigente, nuestra producción de datos terminará».

Ha habido disputas a lo largo de los años sobre el uso de cierto ruido estadístico.

El uso de ruido estadístico en ciertos datos del censo de 2020 generó controversia en el mundo de las estadísticas y la redistribución de distritos antes de su lanzamiento en 2021. Como científico jefe de la oficina, Abowd lideró la implementación de un nuevo sistema de protección de la privacidad basado en un concepto matemático conocido como privacidad diferencial. Los funcionarios de la oficina dicen que los cambios son necesarios para seguir el ritmo de los avances en informática y un acceso más amplio a las listas de registro de votantes y conjuntos de datos comerciales que facilitan la reidentificación de individuos en estadísticas supuestamente anónimas.

Las pruebas iniciales del efecto del sistema en la generación de datos generaron preocupación entre muchos usuarios de datos, que temían que las estadísticas terminaran siendo inutilizables. Los funcionarios estatales republicanos de Alabama demandaron a la oficina para intentar bloquear nuevas protecciones de privacidad. Sin embargo, el caso finalmente se abandonó y, al final, se creó un mapa de distritos electorales en todo el país utilizando datos de redistribución de distritos basados ​​en el censo de 2020.

Pero el año pasado, America First Legal, un grupo legal cofundado por Stephen Miller, subdirector de gabinete de políticas del presidente Trump, presentó una demanda desafiando el sistema de privacidad diferencial de la oficina en un esfuerzo por forzar la publicación de los nuevos resultados del censo de 2020, a pesar de que las cifras de población estatales publicadas no se ajustaron a ningún ruido estadístico. Después de que un tribunal de tres jueces dictaminó que había vencido el plazo para presentar la demanda, los grupos volvieron a presentar su caso y continuaron cuestionando otras técnicas estadísticas utilizadas por la oficina.

A Jarosz, de la Universidad de Georgetown, le preocupa que la nueva prohibición de la administración Trump sobre la manipulación estadística se haya publicado sin muchas explicaciones.

Existe la posibilidad de críticas por parte de otros expertos que no pertenecen al gobierno federal. Y terminamos con un sistema que tenía muy buena transparencia, muchos controles y equilibrios», dijo Jarosz. «Este nuevo orden revierte todas esas cosas. La comunidad no participa en este proceso.

Hasta que la oficina comience a explicar públicamente cómo la orden afecta su divulgación de datos, añadió Jarosz, sigue siendo una cuestión abierta si los participantes de la encuesta de la oficina deberían preocuparse por la confidencialidad de la información personal que comparten con el gobierno.

«La Oficina del Censo y todas las agencias de estadística están obligadas por ley a proteger la privacidad de nuestra información, por lo que han reunido las mejores herramientas que pueden encontrar para hacer precisamente eso», dijo Jarosz. «Si continúan publicando la misma cantidad de datos y no tienen esas herramientas, entonces la privacidad está potencialmente en riesgo».

Editado por Benjamín Swasey



Fuente