BOOK NOW!
[contact-form-7 404 "Not Found"]

glmnet 예제

02 Aug glmnet 예제

다음은 새 데이터를 예측하는 데 필요한 두 가지 사항입니다. 예를 들어, 값을 예측하고 학습한 데이터에 대한 R2 값을 계산합니다: 메서드의 수학적 특성과 실용적인 R 예제, 몇 가지 추가 조정 및 트릭을 모두 다룹니다. 더 이상 애타게 시작하지 않고 시작합시다! 프리드먼, J., 하스티, T. 및 티시라니, R. (2008) 좌표 하강을 통해 일반화 선형 모델에 대한 정규화 경로, https://web.stanford.edu/~hastie/Papers/glmnet.pdf 통계 소프트웨어 저널, Vol. 33(1), 2010년 2월 1-22일 http://www.jstatsoft.org/v33/i01/ 사이먼, N., 프리드먼, J., 하스티, T., Tibshirani, R. (2011) 좌표 하강을 통한 Cox의 비례 위험 모델에 대한 정규화 경로, http://www.jstatsoft.org/v39/i05/ 19. 티시라니, 로버트., 비엔, J., 프리드먼, J., 하스티, T., 사이먼, N., 테일러, J. 및 티시라니, 라이언. (2012) 올가미 형 문제, JRSSB vol 74, http://statweb.stanford.edu/~tibs/ftp/strong.pdf 스탠포드 통계 기술 보고서 글름넷 비네트 https://web.stanford.edu/~hastie/glmnet/glmnet_alpha.html 이 예제의 목표는 LASSO를 사용하여 6개의 잠재적 예측 변수(연령, 성별, bmi_p, m_edu, p_edu 및 f_color) 목록에서 어린이 천식 상태를 예측하는 모델을 만드는 것입니다. 분명히 샘플 크기는 여기에 문제가 있지만 결과가 이진 (1 = 천식; 0 = 천식 없음)일 때 glmnet 프레임 워크 내에서 다양한 유형의 변수 (즉, 연속, 서수, 명목 및 바이너리)를 처리하는 방법에 대한 더 많은 통찰력을 얻고자합니다. 따라서, 천식 상태를 예측하기 위해 위의 데이터와 LASSO를 사용하여이 모의 예에 대한 설명과 함께 샘플 R 스크립트를 기꺼이 제공 하려는 사람이 있습니까? 아주 기본적인 있지만, 나는, 나는, 그리고 이력서에 가능성이 많은 다른 사람을 알고, 크게이 주셔서 감사합니다! TRUE인 경우 각 접기에 맞게 병렬 foreach를 사용합니다.

doMC 등 핸드 전에 병렬로 등록해야 합니다. 아래 예제를 참조하십시오. 그냥 팻에 의해 제공되는 우수한 예에 확장합니다. 원래 문제는 레벨 사이에 내재된 순서(0 < 1 < 2 < 3)와 함께 서수 변수(m_edu, p_edu)를 발생시켰습니다. 팻의 원래 대답에서 나는 이들이 그들 사이에 순서가없는 명목 범주형 변수로 취급되었다고 생각합니다. 나는 틀렸을 지 모르지만, 모델이 고유의 순서를 존중할 수 있도록 이러한 변수를 코딩해야한다고 생각합니다. 이러한 순서요인으로 코딩된 경우(팻의 대답과 같이 정렬되지 않은 요인이 아닌) glmnet은 약간 다른 결과를 제공합니다… 아래 코드에는 정렬 된 요소로 서수 변수가 올바르게 포함되어 있으며 약간 다른 결과를 제공합니다. 이 메서드는 glmnet에서 구현 되지 않습니다. "multnet"과 "mrelnet"만.

클래스당 비영도 수로 구성된 행렬은 올가미 회귀를 실행하기 위해 모델에 오프셋이 포함되었는지 여부를 나타내는 논리적 변수로 구성되지만 알파 매개변수를 1로 설정하면 다시 사용할 수 있습니다. 좌표 하강에 대한 수렴 임계값입니다. 계수 업데이트 후 목표의 최대 변경이 null 편차의 스레쉬 시간 미만이 될 때까지 각 내부 좌표 하강 루프가 계속됩니다.

No Comments

Sorry, the comment form is closed at this time.