visualizing_gradients_tutorial.py 번역#1123
Conversation
|
번역 정말 잘 해주셨습니다. 꼼꼼히 번역하신게 느껴졌습니다. 여기서 몇 가지 수정하면 좋을 것 같은 점들에 대해 적어 보았습니다. 번역하시느라 고생 많으셨습니다!! |
|
번역하시느라 고생 많으셨습니다. 아래는 제가 추가로 수정을 제안드리고 싶은 내용입니다. 이미 다른 분께서 남겨주신 리뷰 내용과 겹치지 않는 부분 위주로 정리해 보았습니다. line 37에서 "'배치 정규화 논문 https://arxiv.org/abs/1502.03167'"처럼 작은따옴표가 사용되어 있는데, reStructuredText 링크 문법상 작은따옴표보다는 백틱을 사용하는 것이 맞을 것 같습니다. " line 177의 "학습 및 시각"은 의미상 "Training and visualization"을 번역한 부분이므로 "학습 및 시각화"가 더 자연스러울 것 같습니다. line 252에서 " line 258의 "파이토치의 자동 미분 시스템 작동하는 방식을"은 조사 "이"가 빠진 표현처럼 보입니다. "파이토치의 자동 미분 시스템이 작동하는 방식을"로 수정하면 문장이 더 자연스러울 것 같습니다. line 276의 "변화도 소실 및 폭주 문제"는 앞부분에서 "변화도 소실/폭발"로 표현되어 있으므로, 용어 일관성을 위해 "변화도 소실 및 폭발 문제"로 맞추는 것이 좋아 보입니다. |
|
리뷰 남겨주셔서 감사합니다. 말씀해주신 부분 반영하여 오탈자 수정 PR 진행하였으니 확인 부탁드립니다! |
hyoyoung
left a comment
There was a problem hiding this comment.
긴 문서 번역하느라 수고하셨습니다.
사소한 몇가지 확인 사항이 있습니다.
확인 후 수정 부탁드립니다
| ===================== | ||
|
|
||
| **Author:** `Justin Silver <https://github.com/j-silv>`__ | ||
| **저자:** `Justin Silver <https://github.com/j-silv>`__ |
| # | ||
| # 순방향 및 역방향 패스를 실행한 후, 모든 중간 tensor에 대한 변화도는 | ||
| # ``grads_bn``과 ``grads_nobn``에 존재해야 합니다. | ||
| # 두 모델을 비교할 수 있도록 각 기울기 행렬의 평균 절댓값을 계산합니다. |
There was a problem hiding this comment.
용어집(TRANSLATION_GUIDE.md)에서는 gradient를 변화도로 하고 있습니다.
문서 내에 기울기 , 변화도가 혼재되어있는데
변화도로 통일 부탁드립니다.
만약 맥락이 안맞는 상황이라면, 영어 단어로 그대로 표기 부탁드립니다.
| A basic knowledge of `how autograd | ||
| works <https://docs.tutorials.pytorch.kr/beginner/basics/autogradqs_tutorial.html>`__ | ||
| would also be useful. | ||
| 시작하기 전에 `tensor와 그것들을 조작하는 방법 |
There was a problem hiding this comment.
의미는 통하나 어색해보입니다
tensor와 tensor 조작법
이나
tensor 조작법으로 해도 괜찮을거 같습니다
| # `BatchNorm1d <https://docs.pytorch.org/docs/stable/generated/torch.nn.BatchNorm1d.html>`__, | ||
| # otherwise it will use the | ||
| # 다음으로, '배치 정규화 논문 <https://arxiv.org/abs/1502.03167>'__에서 | ||
| # 설명된 아키텍처와 유사한, MNIST 데이터셋에 적합한 네트워크를 구축할 것입니다. |
There was a problem hiding this comment.
데이터셋에 적합한 보다는
데이터셋용 이 더 어울릴거 같습니다
| # 해결하는 데 매우 효과적인 기술임을 실험적으로 검증할 것입니다. | ||
| # | ||
| # 우리가 사용하는 모델은 ``nn.Linear``, ``norm_layer``, 그리고 ``nn.Sigmoid``를 | ||
| # 번갈아 사용하는 변경 가능한 개수의, 반복되는 완전 연결(fully-connected) 계층을 가지고 있습니다. |
There was a problem hiding this comment.
조금 더 의역해서
완전 연결 계층을 반복적으로 쌓는 구조이며, 계층 수를 조정할 수 있습니다.
라고 해도 좋을거 같습니다
| # 우리는 배치 정규화가 `변화도 소실/폭발 <https://arxiv.org/abs/1211.5063>`__을 | ||
| # 해결하는 데 매우 효과적인 기술임을 실험적으로 검증할 것입니다. | ||
| # | ||
| # 우리가 사용하는 모델은 ``nn.Linear``, ``norm_layer``, 그리고 ``nn.Sigmoid``를 |
| # gradients if we want to avoid modifying the module code directly. This | ||
| # is done by `registering a | ||
| # hook <https://docs.pytorch.org/docs/stable/notes/autograd.html#backward-hooks-execution>`__. | ||
| # 우리가 ``nn.Module`` 안에 있는 모델의 논리(logic)와 상태를 래핑(wrap up)했기 때문에, |
| # gradients if we want to avoid modifying the module code directly. This | ||
| # is done by `registering a | ||
| # hook <https://docs.pytorch.org/docs/stable/notes/autograd.html#backward-hooks-execution>`__. | ||
| # 우리가 ``nn.Module`` 안에 있는 모델의 논리(logic)와 상태를 래핑(wrap up)했기 때문에, |
| # the network’s layers. | ||
| # tensor 자체에 ``retain_grad()``를 사용하는 것보다 출력 tensor에 연결된 역전파 훅을 사용하는 것이 권장됩니다. ``nn.Module`` 인스턴스가 제자리 연산(in-place operation)을 수행하지 않는다면 모듈 훅을 직접 연결하는 대안(예:``register_full_backward_hook()``)도 있습니다. 더 자세한 정보는 `이 이슈 <https://github.com/pytorch/pytorch/issues/61519>`__를 참고해 주세요. | ||
| # | ||
| # 다음 코드는 훅을 정의하고 네트워크 계층(network layer)에 대한 묘사 명칭(descriptive name)을 수집합니다. |
|
|
||
| ###################################################################### | ||
| # Training and visualization | ||
| # 학습 및 시각 |
라이선스 동의
변경해주시는 내용에 BSD 3항 라이선스가 적용됨을 동의해주셔야 합니다.
더 자세한 내용은 기여하기 문서를 참고해주세요.
동의하시면 아래
[ ]를[x]로 만들어주세요.관련 이슈 번호
이 Pull Request와 관련있는 이슈 번호를 적어주세요.
이슈 또는 PR 번호 앞에 #을 붙이시면 제목을 바로 확인하실 수 있습니다. (예. #999 )
PR 종류
이 PR에 해당되는 종류 앞의
[ ]을[x]로 변경해주세요.PR 설명
이 PR로 무엇이 달라지는지 대략적으로 알려주세요.
intermediate_source/visualizing_gradients_tutorial.py를 번역했습니다.