[태그:] 엑셀

  • 데이터 분석을 떠받치는 수학

    데이터 분석을 떠받치는 수학

    isbn: 9791158391041

    빅 데이터를 현장에 적용하려면 통계를 알아야 된다는 생각으로 여러 책을 골라 봤다. 이 책은 엑셀로도 데이터 분석을 할 수 있음을 보여준다. 당연한거 아닌가? 지금 엑셀보다 좋은 도구들이 많다. 그래도 가끔 필요할 때도 있다. 회사에서 보안을 이유로 다른 프로그램을 막았을 경우.

    mean, median, covariance 등 여러 수식을 설명하고 이를 엑셀로 구해본다. 굳이 구해보지 않아도 되는데 책 작성 목적에 맞게 찾았다. Principal component analysis로 야구 선수를 분석했다. 분석해도 그 분석 결과를 명확하게 설명할 수 없다. 물론 현장에서 어떻게 사용하는지에 따라 다르겠다. 빅데이터에서 insight를 얻으려면 피곤하다. 데이터에서 얻은 insight가 우리 상식을 넘는 새로움을 가지고 있을까? 그런 경우는 얼마나 될까?

    데이터 분석은 입력/출력에 따라 품질 변화가 많다. 어떤 질문을 하고 어떻게 검증하냐가 많은 차이를 만든다.

    여러 기법 등을 적용하여 분석한 불량품 감지도 현장 적용하기 어렵다. 3sigma를 넘어가면 문제라고 보았을 때, 불량을 감지하기 위해서 전수 검사를 해야 한다. 어느 세월에 전수 검사를 하고 있는지…3sigma에 해당하는 제품을 포기하고 손실로 잡는게 맞다. 손실을 줄이기 위해 sigma 수준을 높여야 된다가 결론일 듯 하다.

  • 엑셀 정규 표현식

    엑셀에서 정규 표현식을 쓸 경우가 있다. 정규 표현식이 아니면 엄청 괴로울 수 있다. 고맙게도 선구자가 고민하여 공유했다. 감사합니다. 잘 쓰겠습니다. 위 사이트에서 가져온 코드다.

    Function RegexExecute(r As Range, p As String, Optional g As Boolean = False) As Variant     On Error GoTo ErrHandler
        
        Dim str As String, ptn As String
        str = CStr(r.Cells(1, 1).Value)
        ptn = CStr(p)
        
        Set regex = CreateObject("VBScript.RegExp")
        With regex
            .IgnoreCase = False
            .MultiLine = False
            .Global = g
            .Pattern = ptn
        End With          If regex.Test(str) Then         Set matches = regex.Execute(str)
            Dim temp As String
            temp = ""         For Each Match In matches
                temp = temp & Match
            Next
            RegexExecute = temp
            Exit Function
        End If
        
    ErrHandler:
        RegexExecute = CVErr(xlErrNA)
    End Function