SCAPCI: STATISTICAL CONTROL FOR AUTOCORRELATED PROCESSES CONTINUOUS INSPECTION  

 

Um Programa Computacional para Controle Estatístico de Processos Autocorrelacionados

                          

         

     Desenvolvido por:  

 

Sueli Aparecida Mingoti 

                                                

Fernando Luiz Pereira de Oiveira

 

 

Departamento de Estatística – UFMG 

APOIOS FINANCEIROS: CNPq e FAPEMIG.

 

 

O Controle de Qualidade de Processos Autocorrelacionados

Características de  Qualidade Contínuas

 

 

 

1.0 As Metodologias Clássica e de Geoestatística

 

       A teoria clássica de controle de qualidade (Montgomery, 1996) assume que as unidades amostrais são independentes no que se refere as variáveis respostas (características de qualidade) que estão sendo avaliadas. No entanto, existem vários exemplos de processos autocorrelacionados (Zhang,1998; Box e Luceno,1997). O desprezo destas correlações na construção de modelos estatísticos para avaliar a qualidade de processos pode na realidade, deturpar as estimações feitas para os parâmetros de interesse, como também invalidar certas conclusões ou intervenções tomadas com base em testes de hipóteses, quando se compara por exemplo, precisões nas estimações de parâmetros de locação (como média e mediana) ou variabilidade (como amplitude e desvio padrão) de procedimentos de amostragem diferentes (Alwan & Roberts, 1995). No caso de construção de gráficos de controle, por exemplo, a não consideração da correlação, quando esta na realidade está presente, pode resultar em falhas de dois tipos :

 

(i)  Os limites de controle calculados são menores do aqueles construidos usando-se a informação de correlação. Este é o caso no qual a variabilidade do processo produtivo está sendo subestimada pelo procedimento estatístico usual de estimação de parâmetros. Portanto, a observação do gráfico de controle pode muitas vezes estar indicando erroneamente que o processo produtivo está fora de controle, quando na realidade ele está sob controle estatístico . Este é o caso no qual a correlação entre os ítens amostrais é, em média, positiva e é o chamado "alarme falso";

 

(ii) Os limites de controle calculados são  maiores do que aqueles construidos usando-se a informação da correlação. Este é o caso no qual a variabilidade do processo produtivo está sendo superestimada pelo procedimento estatístico usual de estimação de parâmetros. Portanto, a observação do gráfico de controle pode estar indicando muitas vezes que o processo produtivo está sob controle estatístico, quando na realidade ele não está. Este é o caso no qual a correlação entre os ítens amostrais é, em média, negativa. Este seria o chamado Erro do Tipo II  na terminologia de testes de hipóteses.

 

      As falhas na estimação da variabilidade dos processos também influenciam de maneira negativa os Índices de Capacidade calculados para os processos como pode ser observado em Zhang (1998).                                                                                                                                                                           

      No caso de construção de índices  de qualidade, a não incorporação da correlação existente entre os ítens amostrais nas várias características de qualidade medidas, pode resultar num índice que  não represente adequadamente a qualidade final do produto.

                                                                                                                                                                                 

      Todas as  situações descritas levam a consequências que podem resultar na insatisfação do cliente e no aumento de custos da empresa e portanto, dentro do contexto de qualidade total, devem ser evitadas .

 

      Uma forma de se levar em consideração a informação referente as correlações existentes entre as unidades amostrais populacionais, é resolver-se o problema de estimação de parâmetros utilizando-se a metodologia conhecida como Geoestatística (Cressie,1993). Dentro deste novo contexto a variabilidade existente entre as unidades amostrais populacionais é modelada através de medidas de distância como Variograma, Madograma e Rodograma (Mingoti,1996).

 

      Em Mingoti (2000) novos estimadores de variabilidade construidos usando-se Geoestatística foram propostos. Em Mingoti & Fidelis (2001) e Neves (2001) estes estimadores foram avaliados e apresentaram qualidade superior aos estimadores usuais como o desvio padrão amostral e o de amplitude amostral, nos casos em que a correlação entre unidades amostrais estava presente. Usando estes novos estimadores de Geoestatística o controle de processos para características de qualidade contínuas pode ser feito através do gráfico de controle de Shewhart (1939) substituindo-se, nos limites superior e inferior de controle, a estimativa clássica de desvio padrão por alguma das estimativas obtidas via metodologia de Geoestatística como mostrado em Mingoti & Fidelis (2001). Deste modo, os novos estimadores corrigem automaticamente o efeito da correlação de um  modo mais simples do que as alternativas propostas dentro do contexto de séries temporais, como a modelagem via processos ARIMA ou gráficos do tipo EWMA (Exponentially Weighted Moving Average). Algumas referências nesta linha de controle via Séries Temporais são: Montgomery e Mastrangelo (1991), Roberts (1959), Hunter (1986, 1998) e Epparechet, Ninio e Souza (1998).

        O programa SCAP- módulo CI (continuous inspection) também chamado de SCAPCI, permite que o usuário faça a estimação da variância do processo pelos estimadores clássicos como variância amostral e amplitude amostral bem como pelos estimadores de Geoestatística. Além disso, permite que se faça gráficos de controle de Shewhart e gráficos de autocorrelação amostral do processo para avaliação. É um programa que funciona interativamente com o usuário dentro do ambiente do software estatístico Minitab for Windows, sendo muito simples de ser utilizado e não requerendo do usuário conhecimentos específicos sobre o Minitab para seu uso.

        Exemplos de aplicação podem ser encontrados no manual do usuário que está disponível nesta página para download.

        A seguir descrevemos brevemente os estimadores de variabilidade disponíveis no SCAPCI.

 

 

 2.0  Estimadores de Variabilidade e Desvio  Padrão de Processos: Metodologia Clássica de Controle de Qualidade

 

 

         A estimativa de variância  do processo é obtida a partir de amostras coletadas do mesmo. Suponha-se que tenhamos uma amostra aleatória de tamanho n de unidades amostrais simples do processo denotada por X1, X2, X3, ..., Xn, onde Xi representa a característica de qualidade sob avaliação, com distribuição Normal (,). Então, o estimador não-viciado para a variância do processo  é dado por:

                         (2.1)

onde,   é a média amostral. Para o desvio padrão populacional, o estimador  é definido por:  , que é viciado para . Um outro estimador ainda muito utilizado para  é o de amplitude móvel definido por :

        

                                             (2.2)

onde,    e i=1,2,3,...,n.  A quantidade   é chamada de amplitude média amostral e d2 = 1,128 é uma constante de correção. Para a estimação da variância populacional basta elevar-se a estimativa de  ao quadrado.

         Embora o estimador de amplitude seja não-viciado para , para amostras grandes ele apresenta menor precisão, pois a amplitude é muito influenciada por valores extremos. Os estimadores apresentados nesta seção estão fundamentados na suposição de independência entre as unidades amostrais, no que se refere à característica de qualidade X.  Uma discussão sobre a influência da correlação entre unidades amostrais do processo nestes estimadores pode ser encontrada em Zhang (1998) e Mingoti & Fidelis (2001).

 

3.0     Estimação da Variância via Semi-Variograma Experimental

 

 

        Para que se possa entender os estimadores que serão apresentados nesta seção,  vamos definir brevemente o semi-variograma experimental e a autocorrelação amostral (Box & Jenkins, 1970). Dada uma amostra de tamanho n do processo, X1, X2, ..., Xn , o estimador de Matheron (1963) do semi-variograma () de ordem h, teórico do processo (Cressie, 1993; Mingoti & Fidelis, 2001), é definido por:

                         ," h Î T    (3.1)

 

onde    denota o valor da característica de qualidade  de  interesse  medida no i-ésimo item amostrado, i = 1, 2,..., nT = {1,2,...,n}, e (n - h) é o número de pares (Xi, Xi+h) que estão a distância de h unidades. A autocorrelação amostral de ordem h (), é o estimador da autocorrelação teórica do processo (),  e é definida por:

 

                                             (3.2)

onde  é a média amostral. Neste caso, as funções (,) são estimadas com base na suposição de estacionariedade da série de observações do processo, o  que significa dizer que o processo a ser analisado tem média e variância constantes em Â, ou que o  processo está sob “controle estatístico”. A seguir passamos a definir os estimadores de variabilidade construídos via metodologia de Geoestatística e propostos por Mingoti (2000).

 

3.1       Estimador de Geostatística 1()

 

        Este estimador considera apenas a informação do semi-variograma experimental  de ordem 1, e faz uma correção usando a estimativa da correlação de ordem 1. É um estimador bastante simples, mas viciado devido ao fato de estarmos utilizando estimativas de  e . É definido como:

 

                                                                           (3.1.1)                   

onde  é uma estimativa da correlação de ordem 1 entre as unidades amostrais.

 

          3.2      Estimador de Geostatística 2 ()

 

 

       Este estimador considera não apenas a primeira, mas sim as três primeiras estimativas de semi-variograma e corrige pelas respectivas correlações amostrais. Seria opção para aqueles processos nos quais existam correlações significativas além da de ordem 1. Também é um estimador viciado e definido por:

 

                                                      (3.2.1)

onde  é uma estimativa da correlação de ordem h entre as unidades amostrais, h=1,2,3.

 

3.3      Estimador de Geostatística 3 ()

 

É definido como:

 

                                                       (3.3.1)

 

       É um estimador que considera a média dos valores do semi-variograma experimental até a ordem M, onde M é uma constante que pertence ao conjunto {1,2,...,(n-1)}. Na prática, M deve ser escolhido na vizinhança de [n/2], onde [x] denota o maior inteiro menor ou igual a x. Esta região seria aquela em que as estimativas do semi-variograma teórico teriam maior validade por estarem construídas com um número maior de pares (Xi, Xi+h). Além disso, sugere-se que M seja escolhido de modo que o número de pares usados para estimar  seja no mínimo 30 (Journel e Huijbregts, 1978, p. 194).

      Do ponto de vista prático, (3.3.1) é um estimador fácil de ser implementado e entendido. Este estimador foi primeiramente apresentado no artigo de Mingoti & Fidelis (2001), no qual se faz uma discussão em relação ao vício do estimador e uma comparação com os estimadores clássicos de variância amostral e amplitude amostral apresentados na seção2.0. No artigo, é mostrado que o estimador (3.3.1) é viciado. Os vícios do estimador  e do estimador são muito próximos, dependendo do tamanho n da amostra observada. Entretanto, há uma diferença significativa na precisão destes dois estimadores. Através de resultados gerais demonstrados em Cressie (1985) e  Cressie & Hawkins (1980) para a distribuição de probabilidades de semi-variogramas experimentais por Zhang (1998), Mingoti & Fidelis (2001) mostram que a variância do estimador  é menor que a variância do estimador , a menos que M=n -1=1, valor no qual a variância dos dois estimadores coincidem.

 

3.4        Estimador de Geostatística 4()

 

         É definido por:

 

                                                    (3.4.1)

 

sendo uma extensão do estimador , em que a soma dos valores do semi-variograma experimental é corrigida pela soma das respectivas correlações amostrais, também com o objetivo de redução do vício, sendo M definida como na seção 3.3.

 

3.5        Estimador de Geoestatística 5()

 

       É uma  modificação do estimador  e definido por:

 

                                             (3.5.1)

 

onde M é definida como na seção 3.3. Neste caso, a correção do semi-variograma experimental pela correlação amostral é feita em cada parcela da soma individualmente. É um estimador viciado.

 

        Em todos os casos (3.1-3.5) o desvio padrão do processo é estimado pela raiz quadrada do estimador da variância do processo.

 

4.0     Estimadores Construídos via Semi-Madograma Experimental

 

 

        Os estimadores  foram construídos usando-se a informação da função de semi-variograma experimental do processo. No entanto, podemos pensar em usar outras medidas de variabilidade espacial para construir estimadores para . Uma função interessante é o semi-madograma (Mingoti,1996). Considerando-se que o madograma experimental de ordem h do processo é definido por:

 

                                                      (4.1)

 

então, pode ser mostrado que a esperança matemática de quando o processo é gaussiano é dada por :

 

                                                        (4.2)

 

           Desta forma, um estimador não-viciado para , considerando-se conhecido, seria :

 

                                                                             (4.3)

 

e um estimador para variância  do processo seria:

 

                                                                             (4.4)

 

          Considerando este resultado, podemos construir vários estimadores para utilizando o madograma experimental do processo. O estimador que está implementado no programa SCAPCI é o que considera o semimadograma de ordem 1, isto é:

 

                                                                  (4.5)

 

Este estimador considera apenas a informação do semi-madograma experimental  de ordem 1, e faz correção usando a estimativa da correlação de ordem 1. É estimador bastante simples, mas viciado devido ao fato de estarmos utilizando estimativas de  e .

            Pode ser mostrado que o estimador de amplitude amostral do desvio padrão  mostrado na seção 2.0 (fórmula 2.2) é igual a raiz quadrada do estimador construido via madograma experimental definido por:

                                 

                                         

 

            Portanto, o estimador clássico de amplitude amostral para é um caso particular da metodologia de Geoestatística quando esta é usada para construção de estimadores de desvio padrão do processo, utilizando-se o madograma como medida de variação espacial. Em Journel (1988) é mostrado que o semi-madograma experimental é menos influenciável por valores amostrais discrepantes.

            Uma discussão sobre a qualidade destes e de outros estimadores de variabildiade de processos pode ser encontrada em Neves (2001). Para maiores detalhes técnicos sobre a construção dos estimadores implementados no SCAPCI sugerimos a leitura de Mingoti (2000), Mingoti & Fidelis (2001) e a dissertação de mestrado de Neves (2001).

É interessante observar que todos os estimadores para e  construídos  via Metodologia de Geoestatística são obtidos amostralmente através do semi-variograma ou semi-madograma experimentais, não sendo, portanto, necessário o reconhecimento e ajuste de modelos de semi-variograma ou semi-madograma teóricos do processo.

 

 

5.0 Referências Bibliográficas

 

 

1. ALWAN, L. C. & ROBERTS, H. V. The Problem of missplaced control limits. Applied Statistics, JRSS, Series C, 44, 3, 269-278, 1995.

 

2. BOX, G. P. & LUCENO, A. Statistical Control by Monitoring and Feedback Adjustment. New York: John Wiley & Sons, 1997.

 

3. Box,G.P. & Jenkins,G.M. Time Series Analysis: Forecasting and Control. New York: Holden Day, 1976.

 

4. Cressie, N. Statistics for Spatial Data. New York: John Wiley &      Sons, 1993.

 

5. cressie, N. Fitting variogram models by weighted least squares.Mathematical Geology, v.17, 5,563-585, 1985. 

 

6. CRESSIE, N.  &  HAWKINS, D. M. Robust estimation of the variogram: I. Mathematical Geology,  12, 2, 115-125, 1980.

 

7. EPPERCHT, A. L. , NINIO, A. L. & SOUZA, M. O. Projeto Ótimo de gráficos de médias móveis ponderados exponencialmente (EWMA) para controle estatístico de processos. Pesquisa Operacional, 18, 2, 109-130, 1998.

 

8. HUNTER, J. S. The Box-Jenkins bounded manual adjustment chart: a graphical tool designed for use on the production floor. Quality Progress, 129-137, 1998.

 

9. HUNTER, J. S. The exponentially weighted moving average. Journal of Quality Technology, 18, 202-209, 1986.

 

10.journel, a. g. & HUIJBREGTS, Ch. J. Mining Geostatistics. New York: Academic Press, 1978.

 

11.JOURNEL,A.G. New distance measures: the route toward truly non-gaussian geostatistics. Mathematical  Geology, 20, 04,459-475,1988.

 

12.Matheron, G. Principles of geostatistics. Economic Geology, 58, 1246-1266, 1963.

 

13.MINGOTI, S. A. Aplicação de Novas Ferramentas Estatísticas no Monitoramento do Controle de Qualidade de Processos de Produção.Relatório Técnico de Pesquisa: CNPq. Belo Horizonte: EST/UFMG, 2000.

 

14.MINGOTI,S.A, FIDELIS, M.T. Aplicando a geoestatística no controle estatístico de processos. Produto & Produção, 5, 2, 55-70,2001. (disponível para download)

 

15.MINGOTI, S. A. As funções de madograma e rodograma como alternativas para descrever a variabilidade espacial dos dados. Revista Escola de Minas,  50,  2, 71-74, 1996.(disponível para download)

 

16.Montgomery, D.C. Introduction to Statistical Quality Control . New York: John Wiley, 1996.

 

17.MONTOMERY,D. C. e MASTRANGELO, C. M. Some statistical process control methods for autocorrelated data. Journal of Quality Technology, 23,3,179-193, 1991.

 

18.NEVES, O. F. Estudo de Novos Estimadores para a Variabilidade de Processos. Tese de Mestrado em Estatística (orientadora: Profa. Sueli A. Mingoti). Departamento de Estatística: UFMG, 2001.

 

19.ROBERTS, S. W. Control chart tests based on geometric moving averages. Technometrics, 1, 239-251, 1959.

 

20.SHEWHART, W.A. Application of statistical method in mass production. In: Proceedings of the Industrial Statistics Conference, massachusetts Institute of       Technology, september 8-9, 1938. New York: Pitman Publishing, 1939.

 

21.ZHANG, N. F. Estimating process capability indexes for autocorrelated data. Journal of Applied Statistics,  25,  4,  559-574, 1998.