Co to jest histogram?
Histogram to jedno z siedmiu podstawowych narzędzi jakości i jest częścią szerszej koncepcji o nazwie Statystyczna Kontrola Procesu (SPC).
Jakie inne narzędzia można zastosować? Podstawowe to: Diagram Ishikawy, Arkusz kontrolny, Karta kontrolna, Diagram Pareto, Diagram korelacji, Stratyfikacja / Diagram procesu.
Historgam przedstawia rozkład badanej charakterystyki (np. szerokości wyrobu) w formie wykresu słupkowego. Szerokość danego słupka (W) reprezentuje określony zakres wartości badanej charakterystyki, natomiast wysokość słupka (H) reprezentuje ilość przypadków, kiedy badana charakterystyka zawiera się w danym zakresie.
Poniższy rysunek przedstawia przykładowy histogram:
Jak przygotować histogram?
Zebranie danych
- Należy zebrać minimum 50 pomiarów, aby histogram mógł w miarę dobrze odwzorować badaną charakterystykę w całej populacji. Oczywiście im więcej wyników zostanie zebrane, tym bardziej histogram będzie podobny do badanej populacji, dlatego zalecam pobieranie większej ilości próbek.
- Jeżeli to możliwe, należy pobierać próbki w sposób losowy.
- Należy upewnić się, że metoda pomiaru jest poprawna.
Rozstęp
Obliczamy rozstęp (ang. Range) dla całej pobranej próbki (wszystkich wyników). Rozstęp to wynik odejmowania najmniejszej wartości z próbki od wartości największej.
Ilość przedziałów
Określamy liczbę wymaganych przedziałów (ang. Bins). Nie jest to łatwe zadanie, gdyż nie ma jednego sposobu na określenie ilości przedziałów. Stosuje się wiele różnych metod. Przykładowo:
- Liczba przedziałów (k) to pierwiastek kwadratowy z ilości obserwacji zaokrąglony do najbliższej liczby całkowitej
- Drugim rozwiązaniem jest podział wg normy DIN 55302, korzystając z poniższej tabeli:
- Prof. Kaoru Ishikawa zalecał [1] nastepujący podział:
- Norma CNOMO Norm E41.32.110N (PSA) zaleca następujący sposób:
- Formły matematyczne wg: Rice, Doane, Scott, Freedman-Diaconis, Shimazaki i Shinomoto.
- Inne
Użycie szerszych przedziałów zmniejsza czułość histogramu na zmienność próbkowania. Użycie węższych przedziałów zwiększa tę czułość. Jeśli liczba przedziałów znacznie różni się od zaleceń, to może to mieć znaczący wpływ na wyświetlany kształt histogramu.
Szerokość przedziałów
Szerokość przedziału (W) obliczamy na podstawie następującego wzoru:
Gdzie k to uprzednio obliczona ilość przedziałów a R to uprzednio obliczony rozstęp.
Szerokość przedziału (W) należy zaokrąglić w górę do takie samego miejsca po przecinku, co zebrane dane pomiarowe.
Zakres przedziałów
Dolną granicę dla pierwszego przedziału możemy określić jako minimalną wartość z danych pomiarowych. Jego górna granica to początek kolejnego przedziału. Kolejne przedziały wyznaczamy, dodając do siebie szerokości przedziałów (W). Należy pamiętać, aby przedziały wzajemnie się wykluczały, czyli inaczej mówiąc obserwacje, które znajdują się "na granicy przedziałów" mogą należeć tylko do jednego z nich.
Poniższa tabela zawiera przykładowe zestawienie poszczególnych przedziałów dla k=7, w=0.8 i najmniejszej wartości w obserwacjach = 97.5
Ilość wystąpień (wykres)
Następnie przyporządkowujemy wyniki pomiarów (obserwacji) do poszczególnych przedziałów. Każdy wynik zaznaczamy jedną pionową kreską w kolumnie "Ilość wystąpień".
W ten sposób opracowaliśmy histogram.
Analiza histogramu
Średnia
Średnia (ang. Mean) pozwala nam na oszacowanie, gdzie jest środek analizowanego zbioru obserwacji. Dzięki temu możemy lepiej zrozumieć, jaka jest średnia wartość cechy i ewentualnie porównać ją ze średnią w innych histogramach o podobnej lub nieco innej zmienności. Poniższy wykres przedstawia dwa histogramy o tej samej ilości obserwacji (100), podobnej zmienności, lecz o innej średniej. Dla wykresu A średnia wynosi 100.1; natomiast dla wykresu B średnia wynosi 102.0
Podział danych na oddzielne kategorie (grupy) to stratyfikacja danych - przydatne narzędzie jakości.
Zmienność
Szerokość histogramu odzwierciedla stopień zmienności badanej charakterystyki. Im szerszy jest histogram, tym większa jest zmienność, im węższy histogram tym zmienność jest mniejsza. Zmienność najczęściej jest opisywana za pomocą odchylenia standardowego oznaczonego literą s lub σ (grecka litera sigma). Czasami stosuje się też oznaczenie StDev (ang. Standard deviation). Im większe jest odchylenie standardowe, tym większa jest zmienność danej cechy.
Poniższy wykres przedstawia dwa histogramy o tej samej liczbie obserwacji i średniej, ale o różnej zmienności. Wykres A jest szerszy od wykresu C. Odchylenie standardowe dla A wynosi σ = 0.9389 natomiast wykres C ma odchylenie standardowe σ = 0.4874.
Kształt
Zanim ocenimy kształt histogramu, należy upewnić się, czy badana charakterystyka powinna mieć rozkład normalny, czy też inny niż normalny. Należy o tym pamiętać, aby wyciągać poprawne wnioski.
Jeżeli charakterystyka powinna mieć rozkład normalny a jednak histogram na to nie wskazuje, to mamy wtedy do czynienia z zaburzeniem. To zaburzenie określa się mianem "przyczyny specjalnej" (ang. Special cause). Histogram pozwala nam na wykrycie takich zaburzeń, poprzez analizę kształtu wykresu.
Rozkład normalny ma kształt przypominający dzwon lub górę o jednym szczycie z dwoma podobnie nachylonymi zboczami.
Rozkład skośny (ang. Skewed). To rozkład asymetryczny, ponieważ istnieją jakieś czynniki (naturalne lub zaburzenia), które ograniczają ilość obserwacji poniżej (lub powyżej) pewnej wartości. W zależności od czynnika ograniczającego lub zaburzającego, taki wykres może być prawostronnie skośny (ang. Right skewed) lub lewostronnie skośny (ang. Left skewed).
Rozkład lewostronnie skośny (D) w porównaniu do rozkładu normalnego (A):
Rozkład prawostronnie skośny (E) w porównaniu do rozkładu normalnego (A):
Histogram może także mieć nieregularny kształt lub posiadać kilka szczytów. To może świadczyć o występowaniu przyczyny specjalnej (zaburzeniu) w procesie. Możemy także mieć do czynienia z danymi pobranymi z różnych populacji, wtedy obserwujemy nałożenie się histogramów na siebie.
Oprócz histogramu, warto zastosować kartę kontrolną do oceny procesu i do lepszej identyfikacji przyczyn specjalnych.
Podsumowanie
Dzięki histogramowi można łatwiej zrozumieć, jak wygląda analizowany proces oraz jaka jest średnia, zmienność i kształt analizowanych danych. Porównując histogram z limitami specyfikacji, możemy wstępnie ocenić czy proces/produkt spełnia wymagania. Histogram można wykorzystać w ramach rozwiązywania problemów np. metodą 8D.
Na koniec chciałbym zwrócić uwagę na kilka rzeczy:
- Histogram jak każde inne narzędzie statystyczne może też być błędnie wykorzystane. Zmieniając ilość przedziałów lub ich szerokość można czasami zmieniać kształt wykresu. Dlatego ważne jest, aby podczas analizy histogramu zwrócić uwagę na to, ile mamy pomiarów (n) oraz ile jest przedziałów (k).
- Histogram będzie odzwierciedlał rzeczywistość tylko wtedy, gdy dane będą aktualne i zebrane w odpowiedni sposób (odpowiednią metodą pomiaru). Jeżeli analizowane dane to próbka z większej populacji to należy także upewnić się, że została ona pobrana w sposób losowy.
- Do opracowania histogramu warto stosować dobre oprogramowanie po to, aby nie tracić czasu na obliczenia oraz co ważniejsze, aby nie popełnić błędów w obliczeniach, które mogą skutkować późniejszymi błędnymi decyzjami.
- Zalecam zapoznanie się z metodą Analiza Systemów Pomiarowych, znaną także jako MSA. Ta metoda pozwala zrozumieć, w jakim stopniu pomiar danej charakterystyki jest zaburzony przez zmienność systemu pomiarowego.
Histogram może też służyć jako efektywne narzędzie w komunikacji lub podejmowania decyzji biznesowych szczególnie wtedy, gdy mamy do czynienia z dużą ilością danych trudnych do przedstawienia w innej formie.
Przypisy
- Kaoru Ishikawa "Guide to Quality Control", Asian Productivity Organization, Tokyo, 1976
- E.Dietrich, A.Schulze "Metody Statystyczne w kwalifikacji środków pomiarowych maszyn i procesów produkcyjnych" Wydanie 1, Notika System, 2000