资讯

该数据集主要包含 Python 教学内容 Python-Edu、Web 教育内容 FineWeb-Edu 以及使用 Mixtral-8x7B-Instruct-v0.1 和 Cosmopedia v2 两款模型生成的常识内容,token 量总计 6000 亿。 此后 Hugging Face 团队便使用 SmolLM-Corpus 数据集训练了“SmolLM”小语言模型。
据介绍,这些模型号称是以精心策划的高质量训练数据集训练而成,号称在 Python 程序编写性能上相当强大,团队指出他们重点优化了模型所需的 RAM 用量,“ 即使是在 6GB RAM 的 iPhone 15 上也能运行 ”。
使用python3+写的,使用face_recognition(python开源的人脸识别库)进行人脸识别 ,使用opencv2进行打开显示摄像头图片等,使用pyqt5是ui界面,使用百度AI中的百度语音合成实现语音播报和语音合成,使用对excel的操作以及人脸识别实现模拟签到。
本文的程序是模仿学习国外的大神的 face_recognition Windows8.1 64位 Python版本 python3.6.3 首先安装好OpenCV和face_recognition pip install face_recognition, pip install opencv_python 安装这两个库之前要先安装对应版本的其他一些库,本文不在累赘叙述,安装的过程还是比较麻烦的。