WEBVTT
Kind: captions
Language: pt-PT

00:00:00.820 --> 00:00:02.570
BRADY HARAN: Quero falar de
um número que deve ser

00:00:02.570 --> 00:00:08.480
o mais popular aqui no
Numberphile, o número 301.

00:00:08.480 --> 00:00:10.590
Aqueles que não prestam muita atenção

00:00:10.590 --> 00:00:13.390
aos contadores de visualizações do Youtube,
devem questionar o porquê

00:00:13.390 --> 00:00:16.020
do 301 ser tão popular, e eu vou explicar.

00:00:16.020 --> 00:00:19.170
Quando um novo vídeo é carregado,
e se for muito popular

00:00:19.170 --> 00:00:22.340
vemos o contador de visualizações
a aumentar, aumentar, aumentar

00:00:22.340 --> 00:00:27.020
até chegar ao 301, e aí pára.

00:00:27.020 --> 00:00:31.720
E fica no número 301 por
um dia, talvez 12 horas,

00:00:31.720 --> 00:00:34.390
e a seguir a isso continua a
aumentar normalmente.

00:00:34.390 --> 00:00:36.800
Muitas pessoas acham isto
muito intrigante

00:00:36.800 --> 00:00:37.980
e pediram-nos para abordar o assunto.

00:00:37.980 --> 00:00:39.470
TED HAMILTON: O meu nome é Ted Hamilton,
Sou o Gestor

00:00:39.470 --> 00:00:41.270
de produto do Youtube Analytics.

00:00:41.270 --> 00:00:42.550
BRADY HARAN: E assim o fizemos.

00:00:42.550 --> 00:00:45.560
Entramos em contacto com
as pessoas responsáveis pela

00:00:45.560 --> 00:00:46.810
contagem de visualizações do Youtube.

00:00:46.810 --> 00:00:47.630
TED HAMILTON: É exactamente isso.

00:00:47.630 --> 00:00:49.050
Bom, nós temos computadores
que fazem isso.

00:00:49.050 --> 00:00:51.620
Não as contamos nós próprios, mas sim.

00:00:51.620 --> 00:00:55.180
BRADY HARAN: Antes de discutirmos
esta questão do número 301,

00:00:55.180 --> 00:00:57.170
o que é realmente uma 
visualização no YouTube?

00:00:57.170 --> 00:00:58.130
Sempre me questionei isso.

00:00:58.130 --> 00:01:00.930
Basta clicar no play para
contar como visualização?

00:01:00.930 --> 00:01:01.840
TED HAMILTON: Bem, isso é uma espécie

00:01:01.840 --> 00:01:02.800
de segredo do Youtube.

00:01:02.800 --> 00:01:07.430
Uma visualização deve ser uma
reprodução de vídeo pedida

00:01:07.430 --> 00:01:11.490
por um utilizador que viu o que 
pretendia ver

00:01:11.490 --> 00:01:12.740
e por isso teve uma boa experiência.

00:01:12.740 --> 00:01:16.440
Pensamos nas visualizações como
uma moeda, e por isso

00:01:16.440 --> 00:01:20.320
temos que fazer um esforço
significativo para eliminar

00:01:20.320 --> 00:01:22.360
visualizações fraudulentas,
se quisermos chamar assim.

00:01:22.360 --> 00:01:24.270
BRADY HARAN: Eu sei que isto
parece ser tudo um pouco misterioso

00:01:24.270 --> 00:01:26.720
e voltaremos a isso mais à frente no vídeo

00:01:26.720 --> 00:01:29.250
mas vamos primeiro investigar
a questão do número 301.

00:01:29.250 --> 00:01:31.570
E vamos descobrir que as
visualizações fraudulentas

00:01:31.570 --> 00:01:33.010
até têm algo a ver com isso.

00:01:33.010 --> 00:01:35.380
O que precisamos de perceber agora
é se quando vemos um

00:01:35.380 --> 00:01:38.790
video, como este por exemplo,
provavelmente não o estamos a ver

00:01:38.790 --> 00:01:40.910
a partir do mesmo servidor.

00:01:40.910 --> 00:01:43.170
É distríbuido por servidores de
todo o mundo.

00:01:43.170 --> 00:01:45.400
TED HAMILTON: Há o vídeo original que

00:01:45.400 --> 00:01:46.470
tu vais carregar.

00:01:46.470 --> 00:01:48.090
Ou suponho que quando 
estiverem a ver isto,

00:01:48.090 --> 00:01:49.050
o vídeo já tenha sido carregado.

00:01:49.050 --> 00:01:50.820
Depois fica, como se diz?

00:01:50.820 --> 00:01:54.240
Fica em cache em diferentes locais,
de modo a que quando fazes

00:01:54.240 --> 00:01:56.880
um pedido para ver um vídeo,
ele não tem que ir

00:01:56.880 --> 00:02:01.020
de Londres até à California 
para dizer "OK, manda-me

00:02:01.020 --> 00:02:02.680
de volta esses bytes todos até aqui".

00:02:02.680 --> 00:02:05.230
BRADY HARAN: Com múltiplas
cópias do vídeo espalhadas

00:02:05.230 --> 00:02:08.820
por todo o mundo, contar as
visualizações, começa a ficar

00:02:08.820 --> 00:02:10.080
um pouco mais complicado.

00:02:10.080 --> 00:02:12.120
TED HAMILTON: Aqui estás tu
no teu computador

00:02:12.120 --> 00:02:13.060
a ver o vídeo.

00:02:13.060 --> 00:02:15.480
Se fizeres um pedido a este
servidor, ele vai

00:02:15.480 --> 00:02:16.400
dar-te o vídeo, certo?

00:02:16.400 --> 00:02:19.280
E ao mesmo tempo, o servidor
vai escrever

00:02:19.280 --> 00:02:21.560
uma pequena mensagem num log.

00:02:21.560 --> 00:02:23.060
É apenas uma linha nesse log.

00:02:23.060 --> 00:02:25.590
Depois nós reunimos todas essas linhas,

00:02:25.590 --> 00:02:28.390
mandamos a informação da Europa Central 
ou doutro sítio

00:02:28.390 --> 00:02:31.740
para nossa central de recolha de dados

00:02:31.740 --> 00:02:34.840
reunimos e verificamos todos os logs
e contamos tudo.

00:02:34.840 --> 00:02:37.120
BRADY HARAN: OK, isto parece
bastante simples

00:02:37.120 --> 00:02:40.730
mas não explica o porquê de o contador
de visualizações parar.

00:02:40.730 --> 00:02:42.700
TED HAMILTON: As visualizações,
como mencionei, são uma moeda.

00:02:42.700 --> 00:02:46.590
Quando temos um vídeo com
muito poucas visualizações,

00:02:46.590 --> 00:02:50.050
não precisamos de nos preocupar

00:02:50.050 --> 00:02:51.030
de onde veio essa visualização.

00:02:51.030 --> 00:02:55.250
No entanto, quando se tem 300 ou mais

00:02:55.250 --> 00:02:58.990
desta moeda, precisamos mesmo
de fazer verificação para certificar

00:02:58.990 --> 00:03:01.500
que esse número é o que deve ser

00:03:01.500 --> 00:03:03.600
Isto significa que temos que 
executar um processo

00:03:03.600 --> 00:03:06.700
estatístico de verificação,
e esse processo,

00:03:06.700 --> 00:03:08.960
leva algum tempo.

00:03:08.960 --> 00:03:12.730
E assim deixamos de aumentar
o contador um a um para algo em que

00:03:12.730 --> 00:03:16.380
dizemos: "OK, a partir de agora
vamos incrementar em grupos

00:03:16.380 --> 00:03:19.980
e todas essas visualizações que
vão ser adicionadas, foram verificadas

00:03:19.980 --> 00:03:22.250
e são visualizações reais."

00:03:22.250 --> 00:03:27.860
Queremos evitar que coisas
como bots possam acrescentar

00:03:27.860 --> 00:03:28.740
visualizações a um vídeo.

00:03:28.740 --> 00:03:34.080
Ou excluir os casos em que 
algo tenha enganado

00:03:34.080 --> 00:03:37.130
alguém a ver o vídeo.

00:03:37.130 --> 00:03:39.230
Imagina que tens um título
que é completamente enganador e

00:03:39.230 --> 00:03:42.250
uma miniatura que induziu
em erro as pessoas a clicarem,

00:03:42.250 --> 00:03:45.450
elas viram o vídeo apenas 
por alguns segundos

00:03:45.450 --> 00:03:46.605
e depois saíram.

00:03:46.605 --> 00:03:48.990
Se virmos isso acontecer vezes
o suficiente, é um indicador

00:03:48.990 --> 00:03:52.640
que algo estava errado com
esse vídeo e não devemos

00:03:52.640 --> 00:03:55.050
deixar que todas essas
visualizações contem.

00:03:55.050 --> 00:03:55.730
BRADY HARAN: Tudo bem, então

00:03:55.730 --> 00:03:57.290
Eles estão a verificar os números.

00:03:57.290 --> 00:03:58.790
Estão a verificar tudo.

00:03:58.790 --> 00:04:00.890
Acho que poderíamos 
ter imaginado isso

00:04:00.890 --> 00:04:03.560
Mas porquê 301?

00:04:03.560 --> 00:04:05.280
TED HAMILTON: Eu não estava
aqui quando se decidiu

00:04:05.280 --> 00:04:08.070
mas em algum momento, decidiu-se que
seria preciso definir a diferença

00:04:08.070 --> 00:04:12.040
entre o que era negligível e a
database podia gerir

00:04:12.040 --> 00:04:16.360
facilmente, e o que era mais sério.

00:04:16.360 --> 00:04:20.480
Essa diferença foi traçada
à volta do número 300.

00:04:20.480 --> 00:04:22.090
É esse o número com que
nos precisamos de preocupar.

00:04:22.090 --> 00:04:27.010
Mas a fórmula que usamos para 
chegar a 300, não sei se

00:04:27.010 --> 00:04:28.580
alguém realmente a sabe.

00:04:28.580 --> 00:04:29.310
BRADY HARAN: Bom, OK.

00:04:29.310 --> 00:04:31.150
Eles fizeram uma linha na areia.

00:04:31.150 --> 00:04:32.750
Foi algo arbitrário.

00:04:32.750 --> 00:04:35.940
Eles queriam diferenciar entre
pessoas que apenas queriam partilhar

00:04:35.940 --> 00:04:39.080
os vídeos que faziam em casa,
e os que eram mais populares,

00:04:39.080 --> 00:04:40.760
os que eram mais sérios.

00:04:40.760 --> 00:04:42.730
Aqueles que precisavam de escrutínio.

00:04:42.730 --> 00:04:44.390
E dai surgiu o 300.

00:04:44.390 --> 00:04:47.440
Mas o contador pára nos 301.

00:04:47.440 --> 00:04:49.210
Qual o porquê disso?

00:04:49.210 --> 00:04:50.460
Há alguma razão?

00:04:50.460 --> 00:04:51.780
TED HAMILTON: Sim, há uma razão.

00:04:51.780 --> 00:04:56.480
E a razão é que o número 300
foi escolhido.

00:04:56.480 --> 00:05:00.410
E quando alguém escreve código,
precisa de colocar

00:05:00.410 --> 00:05:03.330
uma condição lógica que diga
ao código quando parar

00:05:03.330 --> 00:05:05.900
ou quando se deve,
se uma condição for verdadeira,

00:05:05.900 --> 00:05:06.660
ir para a esquerda.

00:05:06.660 --> 00:05:08.830
Ou se outra condição for verdadeira,
ir para a direita.

00:05:08.830 --> 00:05:11.880
E a condição pode
ser escrita desta forma:

00:05:11.880 --> 00:05:20.440
Se o contador de visualizações
for menor que 300, então adiciona

00:05:20.440 --> 00:05:21.560
uma visualização ao contador.

00:05:21.560 --> 00:05:30.120
Caso contrário, vai para x,
onde x é o nosso processo

00:05:30.120 --> 00:05:30.900
mais complicado de contagem.

00:05:30.900 --> 00:05:34.610
No entanto, o que foi escrito,
não foi exactamente isso, foi que

00:05:34.610 --> 00:05:39.340
se o contador é menor ou igual
a 300, então incrementa

00:05:39.340 --> 00:05:39.860
uma visualização ao contador.

00:05:39.860 --> 00:05:43.770
O que isto significa é que quando
o contador está em 300, por exemplo,

00:05:43.770 --> 00:05:47.090
está o contador menor ou igual
a 300?

00:05:47.090 --> 00:05:48.000
Sim, está.

00:05:48.000 --> 00:05:48.730
Então vou adicionar 1.

00:05:48.730 --> 00:05:50.495
E assim acabamos com 301.

00:05:50.495 --> 00:05:53.050
BRADY HARAN: Deixem-me recapitular
o que acontece.

00:05:53.050 --> 00:05:55.750
O código que está a controlar quando
o contador de visualizações

00:05:55.750 --> 00:06:00.210
pára, contém um sinal 
de menor ou igual.

00:06:00.210 --> 00:06:03.890
Isto significa quando uma nova
visualização aparece

00:06:03.890 --> 00:06:05.290
é verificada pelo código.

00:06:05.290 --> 00:06:10.070
Supunhamos que o contador
está em 299.

00:06:10.070 --> 00:06:10.810
OK, então.

00:06:10.810 --> 00:06:12.290
Deixamos que outra visualização venha.

00:06:12.290 --> 00:06:14.430
Entretanto chega outra visualização.

00:06:14.430 --> 00:06:16.950
Agora o contador está em 300.

00:06:16.950 --> 00:06:21.150
Isso não é menor que 300,
mas é igual a 300.

00:06:21.150 --> 00:06:24.820
Então o código deixa que essa
visualização conte também para o total.

00:06:24.820 --> 00:06:29.150
Estamos agora em 301, e quando
outra visualização chega

00:06:29.150 --> 00:06:33.150
o total não é menor que 300, mas
também já não é igual a 300

00:06:33.150 --> 00:06:34.540
e a porta fecha-se.

00:06:34.540 --> 00:06:38.090
Não irão haver mais visualizações
adicionadas ao contador público

00:06:38.090 --> 00:06:41.210
até que o Youtube faça
as suas verificações.

00:06:41.210 --> 00:06:43.660
E isso pode demorar entre 12 horas a 1 dia.

00:06:43.660 --> 00:06:46.680
Passado esse tempo, todas as
visualizações que foram contadas

00:06:46.680 --> 00:06:49.430
internamente, são adicionadas ao total.

00:06:49.430 --> 00:06:50.780
Nada é perdido.

00:06:50.780 --> 00:06:52.080
Pelo menos é o que me disseram.

00:06:52.080 --> 00:06:53.820
TED HAMILTON: Provavelmente
quem escreveu o código

00:06:53.820 --> 00:06:56.600
não se apercebeu da dimensão
do que estava a fazer.

00:06:56.600 --> 00:06:58.340
Os contadores de visualizações
existem desde o início do

00:06:58.340 --> 00:07:03.200
YouTube, e quem poderia adivinhar
no que o Youtube se iria tornar.

00:07:03.200 --> 00:07:08.490
Portanto sim, foi um segundo de tempo

00:07:08.490 --> 00:07:12.760
em San Bruno, California,
em que um programador escreveu

00:07:12.760 --> 00:07:13.510
essa condição lógica.

00:07:13.510 --> 00:07:16.240
E é agora uma das idiossincrasias do Youtube

00:07:16.240 --> 00:07:18.100
BRADY HARAN: Consigo imaginar
agora, alguns de vocês

00:07:18.100 --> 00:07:19.480
a gritar para o computador.

00:07:19.480 --> 00:07:22.270
O contador nem sempre pára nos 301.

00:07:22.270 --> 00:07:28.390
Às vezes pára em 302, ou 305 ou 310.

00:07:28.390 --> 00:07:30.750
Porque é que isso acontece?

00:07:30.750 --> 00:07:33.980
Há uma explicação para isso,
e tem a ver com o que disse antes,

00:07:33.980 --> 00:07:37.180
dos vídeos estarem espalhados
em vários servidores

00:07:37.180 --> 00:07:38.330
por todo o mundo.

00:07:38.330 --> 00:07:40.660
Eis o que se passa.

00:07:40.660 --> 00:07:44.200
As visualizações chegam dos
logs dos diferentes servidores

00:07:44.200 --> 00:07:45.910
que estão espalhados 
em diferentes partes do mundo.

00:07:45.910 --> 00:07:48.230
E chegam todos a uma database central

00:07:48.230 --> 00:07:51.330
E sabemos que a porta fecha-se
aos 301 no contador

00:07:51.330 --> 00:07:53.500
como explicamos há um minuto atrás.

00:07:53.500 --> 00:07:57.640
Mas o que aconteçe se as 
visualizações chegarem ao mesmo tempo?

00:07:57.640 --> 00:08:01.200
Se alguém vir o vídeo em África
ao mesmo tempo que

00:08:01.200 --> 00:08:02.340
alguém na Europa?

00:08:02.340 --> 00:08:04.820
Agora temos várias visualizações a chegar.

00:08:04.820 --> 00:08:08.480
Verifica-se se elas podem entrar
para o contador, sim podem.

00:08:08.480 --> 00:08:11.210
É menor ou igual a 300.

00:08:11.210 --> 00:08:14.650
E assim elas são adicionadas
ao total ao mesmo tempo.

00:08:14.650 --> 00:08:17.800
Quando uma nova visualização
tenta entrar, não consegue,

00:08:17.800 --> 00:08:19.430
as portas estão fechadas.

00:08:19.430 --> 00:08:22.240
Por causa das visualizações
simultâneas, algumas

00:08:22.240 --> 00:08:24.690
visualizações extra conseguem entrar.

00:08:24.690 --> 00:08:28.440
TED HAMILTON: Estão-nos sempre
a perguntar isso.

00:08:28.440 --> 00:08:31.860
Não acho que cause propriamente
irritação, mas é certamente

00:08:31.860 --> 00:08:33.820
uma situação que diria chata.

00:08:33.820 --> 00:08:36.409
Podes ir a um vídeo muito popular

00:08:36.409 --> 00:08:40.570
e ver por vezes que ele tem 2,000 likes
e apenas 300 views.

00:08:40.570 --> 00:08:41.840
É algo curioso.

00:08:41.840 --> 00:08:45.780
A questão aqui é que não
submetemos os likes ao

00:08:45.780 --> 00:08:48.930
mesmo processo rigoroso de verificação.

00:08:48.930 --> 00:08:53.080
E os likes são sempre bastante
menos em número, por isso

00:08:53.080 --> 00:08:55.400
os nossos servidores conseguem
gerir mais facilmente.

00:08:55.400 --> 00:08:58.930
Mas as visualizações param,
e isso pode resultar em

00:08:58.930 --> 00:08:59.650
situações estranhas.

00:08:59.650 --> 00:09:03.630
Mas isso resulta em vídeos 
terríficos como este, por isso...

00:09:03.630 --> 00:09:06.660
BRADY HARAN: Eu falei com o Ted
talvez durante 45, 50 minutos,

00:09:06.660 --> 00:09:07.970
e gravei tudo.

00:09:07.970 --> 00:09:10.540
Tenho mais imagens, mais detalhes,
incluindo uma explicação

00:09:10.540 --> 00:09:12.530
mais detalhada sobre o que
é uma visualização.

00:09:12.530 --> 00:09:14.730
E eu sei que alguns de vocês
estão interessados em ver.

00:09:14.730 --> 00:09:17.970
Ainda não tive tempo para editar
tudo, mas fiquem atentos

00:09:17.970 --> 00:09:19.170
porque vou carregar isso para

00:09:19.170 --> 00:09:20.990
o Numberphile brevemente.

00:09:20.990 --> 00:09:23.240
E para aqueles entre vocês que
não gostam de vídeos como este

00:09:23.240 --> 00:09:26.550
que são mais sobre computadores
e internet, peço desculpa.

00:09:26.550 --> 00:09:28.950
O Numberphile tem sempre algo
inesperado, e prometo

00:09:28.950 --> 00:09:30.390
que da próxima vez, 
o vídeo será sobre algo que

00:09:30.390 --> 00:09:31.786
gostarão mais.

00:09:36.110 --> 00:09:37.350
MATT PARKER: Quantas setas queres?

00:09:37.350 --> 00:09:40.720
Então para o próximo, digamos que
fazemos 3 elevado a, elevado a,

00:09:40.720 --> 00:09:43.410
elevado a, oh, seta, seta,
seta, ou como quer que queiras

00:09:43.410 --> 00:09:45.360
chamar a isto.

00:09:45.360 --> 00:09:46.550
3.

00:09:46.550 --> 00:09:47.800
Será--

