Funcinema

Cine y Big Data

Por Nicolás Garcette

(@nico_sables)

“L’art est fait pour troubler. La science rassure. Il n’est en art qu’une seule chose qui vaille : celle qu’on ne peut expliquer.” (Georges Braque, Le jour et la nuit, Cahiers 1917-1952).

“El arte está hecho para perturbar. La ciencia tranquiliza. En el arte hay una sola cosa valiosa: la que no se puede explicar.” (1)

¿Qué es el “big data”?

big dataLa expresión “big data” se refiere a un volumen de información inédita en la historia de la humanidad, a esas cantidades desmedidas de información conservadas en los servidores y los discos duros, que se incrementan además de manera exponencial. Su explotación podría cambiar radicalmente el modo de comprender nuestro entorno, si ya no empezó a hacerlo. Esta revolución estaría en lo datos mismos y en la manera con la cual se usan (2). El big data proporciona en particular información individualizada sobre los gustos de los consumidores que se acumula con cada clic, cada toque de pantalla, cada frase escrita en las múltiples redes que componen internet. Es por ejemplo lo que permite a Netflix seleccionar determinados productos audiovisuales de su catálogo para recomendarlos a sus usuarios: para eso utiliza la información que estos mismos usuarios proporcionan sobre sus gustos a través de sus búsquedas, sus comentarios, sus propias selecciones y recomendaciones de películas, series y otros programas audiovisuales. Netflix descubrió de esa manera que al 10% de sus usuarios que miraban la serie Los Sopranos le gustaba también la sitcom Two and a Half Men. Ese resultado llevó la distribuidora a ofrecer esta sitcom en la columna de recomendaciones de los aficionados de Los Sopranos. La cifra pasó del 10% al 20%, generando aún mayores beneficios para Netflix (3).

¿Cuál es la relación entre el big data y el cine?

El big data empezó a utilizarse no solamente en los procesos de distribución de los productos audiovisuales para aconsejar a los espectadores-usuarios, pero también en los procesos de producción para aconsejar a los directores, productores y inversores. La gran pregunta que se plantean, sobre todo los productores e inversores, es simple: ¿Cuál es la receta del éxito? ¿Qué hace que una película se vuelva un hito o un fracaso?

A esa pregunta, ya varios estudios estadísticos universitarios intentaron dar una respuesta antes de la llegada del big data. En general, estimaban el impacto que podía tener sobre la recaudación (variable a explicar) un conjunto de variables (variables explicativas) incluyendo: la fecha de estreno, el costo de producción total, el gasto en publicidad, la compañía distribuidora, la cantidad de pantallas en el momento del estreno, el país de origen de la película, el género al cual pertenece (drama, comedia, horror, etcétera (4)), el tipo al cual pertenece (remakes, precuelas, secuelas, franquicias, reboots , etcétera (5)), su calificación para la explotación, la presencia de desnudos explícitos, la cantidad de premios recibidos, el actor y la actriz principal, el director, el productor, el guionista, el director musical, las reseñas profesionales, entre otros (6). Sin embargo, una de sus principales limitaciones era que la cantidad de películas (la muestra estadística) que usaban para el análisis era muy pequeña, apenas algunas centenas en el mejor de los casos. Otra limitación importante era la poca cantidad de variables potencialmente explicativas sobre las cuales tenían suficiente información.

En cambio, con el big data, la cantidad de películas que se pueden tomar en cuenta junto con la cantidad de información disponible sobre esas películas cambian de escala. Así, el sitio web www.the-numbers.com construyó una base de datos que explota alrededor de 750.000 de documentos cubriendo cerca de 13.000 películas comerciales estadounidenses. Estos documentos incluyen por cada película su presupuesto, su género, su casting, su equipo de rodaje, su modo de producción, los premios que recibió y sus recetas (en el box office nacional e internacional, en ventas y alquileres de DVD y Blu-ray, en ventas a canales de televisión), entre otros. Esta base de datos incorporaría también un embrión de conexiones humanas, como por ejemplo el hecho de que este guionista ya trabajó con este director, este director con este actor, etcétera (7).

Explotando esta base, este sitio busca correlaciones que predicen el ingreso potencial para películas todavía al estado de proyectos. En términos estadísticos, una correlación calcula en qué medida dos variables varían sistemáticamente en la misma dirección o en direcciones opuestas. Por ejemplo, habrá una alta correlación entre el ingreso total y el presupuesto publicitario de las películas si el ingreso total aumenta sistemáticamente cuando el presupuesto publicitario aumenta (correlación positiva) o si el ingreso total disminuye sistemáticamente cuando el presupuesto publicitario aumenta (correlación negativa). De hecho, como es de esperar, los estudios empíricos que investigaron esa relación encontraron en general una correlación positiva: a mayor presupuesto publicitario, mayor probabilidad que la película se vuelva un éxito (8). Cabe subrayar que correlación no implica causalidad. Para establecer esa última, se necesita otros ejercicios estadísticos más complejos. En todo caso, averiguar si la correlación significa causalidad entre las dos variables, en otras palabras encontrar un mecanismo lógico escondido detrás de esa correlación, se vuelve secundario.

Con el big data, lo que importa es identificar correlaciones que permitan prever el comportamiento futuro de algunas variables de interés. En nuestro ejemplo, no importa tanto saber por qué existe una relación entre el nivel del gasto en publicidad y la recaudación total (9), lo que importa es poder estimar cuánto aumenta la recaudación total cuando el presupuesto publicitario aumenta de un dólar, información que los productores y distribuidores pueden encontrar útil. Es exactamente lo que ofrece el sitio web www.the-numbers.com a productores independientes (bajo cierto costo obviamente): propone estimaciones de los ingresos para el fin de semana de estreno y de los ingresos totales que podrían recaudar las películas que están desarrollando en función de sus características. Los productores llevan esta información a los estudios o a inversores para conseguir financiamiento. Podría hasta indicar qué variables habría que cambiar para aumentar sus ganancias o disminuir sus pérdidas: por ejemplo, la magnitud del presupuesto, si el actor principal tendría que ser uno de los más famosos y rentables en la actualidad (pertenecer a la lista A) o no, entre otros. Este sitio propone también una estimación de los ingresos que determinado actor, productor o director puede generar, basada en sus logros pasados y la red de personas con la cual estuvo asociado.

¿El futuro de la producción cinematográfica?

Eso es solamente el inicio. Se podría refinar el análisis, transformar en estadísticas las opiniones sobre las películas que dejan los usuarios de las redes sociales (Facebook, Twitter, etcétera), los comentarios que dejan en los sitios de cine masivos (IMDB por ejemplo), a través de palabras claves, lo que de hecho ya se empezó a hacer, y mejorar las estimaciones que permitan prever los ingredientes del éxito (10). Además, con el desarrollo de la Video On Demand (VOD) y de los sitios como Netflix, se podrá determinar también cuántos espectadores miran una película hasta el final, dónde los que no la miran completa la interrumpen, qué parte(s) vuelven a ver, qué parte(s) aceleran (11). El siguiente paso será cruzar esa información con las características de las películas y medir el nivel de correlación entre ellas. Seguramente habrá algunos productores que, en base a esos resultados, buscarán “mejorar” el ritmo de las películas, eliminando o cambiando escenas que, según los datos analizados, “no funcionarían” y aburrirían a los futuros espectadores, agregando otras que, según esos mismos datos, serían vistas mil veces.

Se puede objetar que desde el inicio del cine, lo hacen, basándose en particular en los test screenings realizados antes de los estrenos (12). Sin embargo, con el big data, cambiamos de escala y ese cambio de escala es fundamental. Corresponde a un cambio radical de paradigma en términos de producción. Ya no se trata más de algunos test screenings, se trata de miles y miles de datos que permiten analizar de manera muy precisa el comportamiento de miles y miles de espectadores. A la diferencia de esos test screenings que juntan información sobre la opinión de una muy pequeña muestra de espectadores, con los errores que eso suele implicar, en particular los errores de muestreo (la población seleccionada por los test screenings no siendo representativa de la población general de espectadores), la información que se obtiene ahora con el big data está basada en una muestra gigante. Incluso se podría imaginar a futuro, sin que eso sea totalmente descabellado, que esos sitios no estarán lejos de tener información sobre la población total de espectadores. Además, una parte de esa información, la que se registra cuando los espectadores miran la película en un sitio de VOD o Netflix por ejemplo, está basada en observaciones directas del comportamiento de los espectadores, no en lo que reportan como es el caso en las planillas de los test screenings, sino directamente en lo que hacen cuando miran las películas. Con el big data, la información disponible es gigantesca y por parte directa. Es prácticamente un censo en tiempo real, donde los comportamientos están casi literalmente a la vista. En consecuencia, el análisis se vuelve mucho más preciso, mucho más refinado, sin comparación con lo que se hacía antes con los test screenings.

Eso permitiría diseñar películas, personajes por personajes, escenas por escenas, exclusivamente en base a la información contenida en el big data, para complacer a un público previamente determinado. Asimismo, en base a esa información recopilada sobre los gustos pasados y presentes de los espectadores, para optimizar los ingresos se podrá determinar cuál es el mejor momento del año para estrenar determinada película y en qué lugares estrenarla en función de las costumbres culturales locales.

Las limitaciones del uso del big data en el cine

“Estadísticas son historia”. En ese sentido, el uso del big data en el cine llevaría a acentuar las tendencias cinematográficas presentes, ya que los resultados encontrados se basan en datos presentes y pasados. Con el big data, el riesgo es precisamente no arriesgarse más, copiar las recetas exitosas del pasado, lo que ya es la inclinación que sigue actualmente la industria cinematográfica con la multiplicación de los remakes, precuelas, secuelas, franquicias y reboots. El riesgo que representa el big data para el cine es entonces una aceleración en la homogeneización de los contenidos audiovisuales y en los gustos que se alimentan entre sí. En otras palabras, el big data podría resultar en una revolución que huele fuertemente a conservadurismo.

Sin embargo, incluso cuando se puede, en cierta medida, predecir lo que les gustaría a los espectadores, no hay que olvidarse que buenos resultados pasados no son garantes de buenos resultados futuros. En otras palabras, los gustos de ayer o de hoy no son necesariamente los de mañana, porque fundamentalmente, al espectador, le gusta también la novedad. Volver a ver el mismo tipo de películas una y otra vez termina produciendo aburrimiento, incluso cuando se trata de La guerra de las galaxias. C3-PO y R2-D2 hasta el fin de los tiempos cinematográficos, ad nauseam, no, gracias. El big data nos dice lo que funcionó, que, es cierto, puede volver a funcionar, pero sólo según cierta probabilidad, no de manera segura. Ahí reside a la vez su justificación y su límite. En ese sentido, siendo optimista, siempre habrá algún productor aventurero para apostar sobre un director, una historia, en fin, una película que sería totalmente descartada al considerar exclusivamente lo indicado por el big data, pero que su instinto verá como un posible éxito (o que su razón le susurrara que es necesaria) a pesar de todo y contra todos. Lo más probable es que a futuro la decisión de producir una película o no será el producto de una mezcla de elementos racionales basados en el big data y otros más pasionales, enraizados en el instinto del productor (13).

En todo caso, el big data permitiría establecer una cartografía precisa de los gustos de los espectadores y de las tendencias culturales presentes, siendo al final quizás de mayor uso para las ciencias sociales que para la industria cinematográfica. Puede ofrecer indicaciones para las próximas tendencias, pero solamente esto, indicaciones. Algunas serán acertadas, otras no. Algunos productores, quizás la mayoría, las seguirán ciegamente hasta equivocarse, otros las descartarán completamente hasta equivocarse también. Big data o no, seguirán fracasando cada tanto películas que estaban destinadas al éxito y que años después, décadas después, entrarán en la categoría de las películas de culto.

Ahí queda la magia del cine.


1. Traducción del autor.

2. Véase por ejemplo Viktor Mayer-Schönberger y Kenneth Cuckier, Big Data: A revolution that will transform how we live, work and think, 2013, Houghton Mifflin Harcourt Ed.

3. Véase: http://nofilmschool.com/2014/04/david-simon-nate-silver-on-big-data-future-of-storytelling/

4. Se puede refinar aún más la tipología. Así, para dar una mayor precisión al análisis, un estudio sobre los determinantes de la recaudación de las películas de horror incluyó el subgéneros al cual pertenecían: vampiro, zombi, “slashers” y… comedia. Véase: Terry, Neil, Robert King y Jeri J. Walker, “The Determinants of Box Office Revenue for Horror Movies”, Mimeographed.

5. Un “remake” corresponde a la nueva versión de una misma película. La película Psycho de Gus Van Sant es por ejemplo el remake perfecto, respectando plano por plano la de Hitchcock.
Una “precuela” designa una película cuya acción precede la de la película original. Así, Star Wars Episodio I: la amenaza fantasma se hizo después de La Guerra de las estrellas original, pero su historia se desarrolla antes.
Al revés, una “secuela” corresponde a una película cuya acción sigue la de la película original. Así, El Imperio contra ataca es la secuela de la Guerra de las estrellas.
Una “franquicia” se refiere a una propiedad intelectual incluyendo personajes, lugares y marcas comerciales relacionados con un producto mediático original. La Guerra de las estrellas, James Bond, Indiana Jones y los varios personajes de Marvel son tantas franquicias.
En fin, un “reboot” retoma una franquicia con nuevas bases. La serie de Batman realizada por Christopher Nolan es un reboot de la iniciada por Tim Burton.

6. Véase por ejemplo: Basuroy, Suman, Subimal Chatterjee y S. Abraham David, “How Critical are Critical Reviews? The Box Office Effects of Film Critics, Star Power and Budgets”, Journal of Marketing, October 2003, Volumen 67, Paginas 103-117 (Consideraron 200 peliculas); Song, Jongwoo y Suji Han, “Predicting Gross Box Office Revenue for Domestic Films”, Communications for Statistical Applications and Methods, 2013, Volumen 20, No 4, Paginas 301-309 (206 peliculas); Terry, Neil, Robert King y Jeri J. Walker, “The Determinants of Box Office Revenue for Horror Movies”, Mimeographed (225 peliculas); Pangarker N.A. y E.v.d.M. Smit, “The determinants of box office performance in the film industry revisited”, South African Journal of Business and Management, 2013, Volumen 44:3, Paginas 47-70 (289 peliculas); Simonoff, Jeffrey S. y Ilana R. Sparrow, “Predicting movie grosses: Winners and losers, blockbusters and sleepers”, Chance, Verano 2000, Volumen 13:3, Paginas 15-24 (311 peliculas); Fetscherin, Marc, “The Main Determinants of Bollywood Movie Box Office Sales”, Journal of Global Marketing, 2010, Volumen 23:5, Paginas 461-476 (330 peliculas), Topf, Patrick, “Examining Success at the Domestic Box Office in the Motion Picture Industry”, Honors Projects, Paper 110, 2010 (538 peliculas), etc.

7. Véase: Viktor Mayer-Schönberger y Kenneth Cuckier, Big Data: A revolution that will transform how we live, work and think, 2013, Houghton Mifflin Harcourt Ed.

8. Véase por ejemplo: Terry, Neil, Robert King y Jeri J. Walker, “The Determinants of Box Office Revenue for Horror Movies”, Mimeographed; Elberse, Anita y Bharat Anand, “The effectiveness of pre-release advertising for motion pictures: An empirical investigation using a simulator market”, Information Economics and Policy, 2007, Volumen 19, Paginas 319-43.

9. La explicación más obvia es que la publicidad logra estimular el interés por una película de manera masiva y por lo tanto lleva más espectadores a verla, lo que se repercuta directamente en el nivel de la recaudación. Para más detalles sobre los mecanismos que gobiernan la publicidad, véase They live del director John Carpenter.

10. No hay que olvidarse que se trata siempre de estimaciones y promedios, lo que significa que siempre habrá casos de películas exitosas que no hayan incorporado todos esos ingredientes y que aparecerán como excepciones o “sorpresas”.

11. Los cambios en los procesos de producción que ya están en camino en la industria cinematográfica se pueden vislumbrar también en el sector del libro con la difusión de los libros electrónicos.

12. Antes del estreno de una película, se la proyecta a una selección de espectadores para evaluar sus reacciones. Al final de la proyección, se les pide llenar un cuestionario sobre la película. En base a sus respuestas, se cambia o no parte(s) de la película, con o sin el acuerdo del director.

13. En esto, la industria cinematográfica podría seguir el ejemplo del baseball en los Estados Unidos, donde los equipos seleccionan ahora sus jugadores a partir del análisis de estadísticos y de los cazatalentos tradicionales. Véase: Silver, Nate, The Signal and the Noise: Why So Many Predictions Fail – but Some Don’t, The Penguin Press, 2012, New York.

Comentarios

comentarios

1 comment for “Cine y Big Data