Histogramas
O histograma é um gráfico de barras que
mostra a variação de uma medida em um grupo de dados através da distribuição de
freqüência. (JATOBÁ, 2004)
Em outras palavras é um gráfico
onde a amostra de dados é agrupada em pequenas faixas de valores, e essas
faixas são colocadas lado a lado em um gráfico de barras para representar em
que faixa o evento ocorre com maior freqüência. Esse gráfico foi proposto por
Guerry em 1833, quando ele queria analisar dados sobre crimes, e desde então o
histograma tem sido utilizado nas mais diversas áreas.
As aplicações do histogramas são:
- Apresentar um padrão de variação;
- Comunicar visualmente a informação sobre o comportamento do processo;
- Decidir onde devem ser concentrados os esforços para a melhoria;
- Determinar a dispersão dos valores.
Gráfico 1: Modelo de histograma
Fonte: Kanamura, 2002
Quanto
mais alto forem os picos do histograma, maior a freqüência do evento naquele
intervalo, e o gráfico pode resultar em diversas formas como mostrado no Gráfico 2.
É possível repara que os histogramas geralmente possuem seu maior pico no
centro do gráfico, isso é devido ao gráfico muitas vezes ser utilizado para
demonstrar, por exemplo, a medida de uma peça em que o diâmetro deve ser de 42 cm , porém, a peças saem
tanto com 36 cm
quanto com 49 cm ,
e isso gera um gráfico nesse formado quando o processo está sob controle, pois
quanto mais distante do valor desejado, menor a freqüência e consequentemente
menor o pico. Mas se num caso como o exemplificado acima, o maior pico estiver
próximo das margens do gráfico, com 46cm por exemplo, significa que o processo
necessita melhora.
Gráfico 2: Tipos de Histogramas
Fonte: Jatobá, 2004
Construção do histograma
Primeiramente,
como todos os outros levantamento deve-se planejar como será construído o
histograma e entender plenamente os conceitos de amplitude (R), classe (K),
freqüência de classe, média e desvio padrão, então vamos resumir o que é cada
um desses:
Amplitude (R): Variação entre a maior e
o menor valor da amostra;
Classe (K): é a quantidade de
intervalos em que a amostra será dividida, e representa as barras do
histograma;
Freqüência de classe: A quantidade de que estão no intervalo de cada classe;
Média: Média dos valores da amostra;
Desvio Padrão: o quanto os valores se
desviam da média ou do valor padrão.
Como
exemplo iremos construir o gráfico baseado nos dados apresentados a seguir:
Tabela 1: Dados fictícios para histograma
Intervalo de dados
|
|||||
4
|
7
|
12
|
21
|
27
|
18
|
12
|
0,5
|
20
|
8,5
|
18
|
26
|
3
|
7
|
4
|
9
|
10
|
11
|
1,5
|
12
|
8
|
8
|
2
|
13
|
34,5
|
12
|
7
|
10
|
5
|
5
|
25
|
16
|
9
|
27
|
19
|
16
|
21
|
13
|
7
|
10
|
5,5
|
2
|
16
|
8
|
7
|
2
|
3
|
4
|
12
|
18
|
7
|
1
|
4
|
8
|
5
|
6
|
1
|
5
|
2
|
0,5
|
Baseado na
Tabela 1,
iremos definir agora a amplitude (R) da nossa amostra que é o maior valor
subtraindo o menor valor:
R = maior valor – menor valor è
34,5 – 0,5 è R
= 34,0
Agora que
já temos nossa amplitude precisamos determinar o número de classes (K). O
número de classes pode ser determinado pela raiz quadrada de n (tamanho
amostra), que no nosso caso é 60:
K = √60 =
7,7 (Aproximadamente 8)
Mas é
comum o uso de tabelas para a determinação de K como exibido na Tabela 2:
Tabela 2: Tabela para valores de K
Como
podemos ver, o valor de K para n=60 é entre 6 e 10, logo, o valor encontrado
está dentro da tabela e portanto está correto.
Para
determinarmos o intervalo de cada classe basta dividirmos a amplitude pelo
número de classes como a seguir:
H = R / K = 34 / 8 è
H = 4,25
O valor é
aproximadamente 4.
Agora
devemos determinar os limites das classes. Para determinarmos os limites
devemos pegar o menor valor da nossa amostra e somar o valor de H, no nosso
caso o menor valor é 0,5 mas podemos considerar 0, assim a primeira classes
será de 0 a 4. A próxima classe deve tomar a valor superior da outra classe como
valor inferior e somar 4, assim sendo teremos 4 + 4 = 8, ou seja, a próxima
classe terá um intervalo de 4 a 8, e assim sucessivamente.
Mas temos
um inconveniente acima, o valor 4 irá entrar na primeira classe, na segunda
classe ou em ambas as classes? Com certeza ele não poderá entrar nas duas
classes logo, o que geralmente é feito, é determinar que a primeira classe
receberá valores de zero até valores menores que quatro, ou seja, de 0 a
3,999999 e a próxima classe de 4 a 7,999999 e assim por diante até chegarmos a
uma classe que comporte a maior valor do intervalo. Na Tabela 3
podemos ver como as classes ficarão:
Tabela 3: Intervalos e Frequência do
Histograma terminado
Faixa do Histograma
|
Bloco
|
Freqüência
|
|
3,9
|
3,9
|
11
|
|
7,9
|
7,9
|
16
|
|
11,9
|
11,9
|
11
|
|
15,9
|
15,9
|
7
|
|
19,9
|
19,9
|
7
|
|
23,9
|
23,9
|
3
|
|
27,9
|
27,9
|
4
|
|
31,9
|
31,9
|
0
|
|
35,9
|
35,9
|
1
|
Com isso basta
criarmos o gráfico e analisarmos como os dados se distribuem no histograma.
Gráfico 3: Histograma completo com os
dados da Tabela 3
Com o
gráfico podemos observar de maneira clara que o intervalo de 4 a 7,9 o evento se
repete 16 vezes, isso significa que se quiséssemos medir o real diâmetro de uma
peça, ele seria, na maior parte da vezes entre 4 e 7,9 cm por exemplo, mas que
se repete muitas vezes fora da faixa, e talvez o processo necessite de melhora.
Podemos
verificar também nesse gráfico, que ele possui uma classe sem nenhum evento,
isso significa que nosso arredondamento para 8 no número de classes foi
equivocado e que deveríamos ter utilizado apenas sete classes.
Erros mais frequentes
- Desconfie de Histogramas que possuam classes muito altas nas margens;
- Nem todos os histogramas tem um pico no meio, alguns podem ter picos nas laterais, como um histograma da quantidade de fraldas utilizadas por um bebê, provavelmente nesse caso o maior pico é no início;
- Classes sem eventos;
- Dois picos de alta frequência geralmente representam erros, seja na separação das frequências, seja no planejamento do histograma.
Colocando em prática
Deve se
ter muita atenção no momento de colocar cada evento dentro de sua classe quando
o processo for realizado de maneira manual pois erros são muito frequentes nesses casos.
Cuidados
básicos devem ser tomados, e além do cuidado mencionado no parágrafo acima,
deve-se esclarecer o pessoal da produção assim como na Folha de Verificação
para que o processo ocorra de maneira normal e representativa.
O MS Excel
2007 é uma ótima ferramenta para a criação automática do Histograma, na aba
Dados, opção Análise de Dados. Basta adicionar os dados da amostra e os
intervalos das classes que ele fará a distribuição dos dados amostrais dentro
das classes e com isso bastará criar o gráfico de barras.
Referência
JATOBÁ,
Paulo César. As Ferramentas da qualidade
- Aprendendo a aplicar para solucionar problemas: BANAS, 2004. Disponível em
<www.banasqualidade.com.br>.
Acesso em 12/08/2013 as 09:40.
KANAMURA,
Alberto Hideki; NETO, Gonzalo Vecina; ARAKI, Paulinho Shiguer; MALIK, Ana
Maria. Manual do Programa de Gestão da
Qualidade do Hospital das Clínicas da Faculdade de Medicina da Universidade de
São Paulo: 2002. Disponível em < http://portalses.saude.sc.gov.br/arquivos/sala_de_leitura/saude_e_cidadania/ed_03/pdf/07_01.pdf
>. Acesso em 09/07/2013 as 07:35.
MARTINS, Rosemary.
Histograma: Blog da Qualidade, 2012.
Disponível em < http://www.blogdaqualidade.com.br/histograma/
>. Acesso em 18/09/2013, 12:35.