Text this: Estimación del número de personas en movimiento en una secuencia de video