Code Search Net说明

需要安装docker和Nvidia-Docker，其中docker需要指定19.03版本。在安装的过程中系统的nvidia-driver可能会更新，导致版本不一致问题：
- docker run --gpus all nvidia/cuda:10.0-base nvidia-smi会报错：E: Couldn't find any package by glob 'nvidia-driver-440.33.01'
- nvdia-smi也会报错：Failed to initialize NVML driver/library version mismatch
- cat /proc/driver/nvidia/version查看显卡驱动所使用的内核版本，cat /var/log/dpkg.log | grep nvidia查看电脑驱动，参考https://blog.csdn.net/qq_40200387/article/details/90341107
- 尝试了多种方法，最后应该是卸载并重新安装了对应版本的driver后，注意要重启机器sudo reboot now🤦‍♀️
安装成功后根据指令执行即可：script/setup会下载相关数据集，并构造进入相应的container，script/console进入相应的container，该过程需要在每次运行代码前都执行
运行前可以选择是否要登录W&B账号，从而可以上传到系统，查看运行可视化结果，并提交
在docker容器内运行时，不能直接退出，即使用了nohup也程序也会终止。可以按Ctrl+P+Q退出但不关闭容器，然后再需要重新进入容器时，通过docker ps -a查找正在运行的容器id，然后docker attach id进入指定容器

在训练过程中会计算MRR值
- MRR：标准答案在被评价系统给出结果中的排序取倒数作为它的准确度，再对所有的问题取平均
- $MRR = \frac{1}{ Q } \sum_{q \in Q} \frac{1}{rank_q}$
- 一组正例对应999个负例
最终提交的结果，是在给定了99个queries，然后返回这些queries的6种语言上预测结果，计算NDCG值
- NDCG: 考虑了返回列表中元素与查询的相关性（相关性根据给定指标决定，然后对指数函数），计算更复杂
- $N(n)=Z_n \sum_{j=1}^n (2^{r(j)} - 1) / \log(1+j)$
- 在有注释的代码中查询 / 在整个代码库中查询，最终的应该是后者（更有意义）
运行python predict.py后，会生成predictions.csv文件，注意到在代码里是通过wandb API上传至服务器，从而可以直接提交。如果是用自己的预测方法，也要用类似的方法上传。