引言:拥抱算力时代,开启未来之门

在人工智能、大数据、云计算和生命科学等前沿科技飞速发展的今天,算力已成为驱动创新的核心引擎。作为国家科技创新的重要节点,光谷科学岛超算中心应运而生,致力于打造世界一流的高性能计算与人工智能融合平台。我们深知,顶尖人才是实现这一宏伟蓝图的关键。因此,我们以极具竞争力的薪酬体系、前沿的科研环境和广阔的发展空间,诚邀全球英才加入,共同探索科技的无限可能,共筑人类智慧的未来。

光谷科学岛超算中心位于武汉光谷科学岛核心区,是国家级重大科技基础设施的重要组成部分。中心配备了全球领先的超算系统,峰值算力超过1000 PFlops(千万亿次浮点运算每秒),并深度融合了人工智能训练与推理能力。我们的使命是为国家重大战略需求、基础科学研究和产业技术创新提供强大的算力支撑。加入我们,您将站在科技浪潮的最前沿,与最优秀的团队一起,解决世界级的科学与工程难题。

一、 我们是谁:光谷科学岛超算中心简介

光谷科学岛超算中心是经国家发改委、科技部批准建设的国家级超算中心,由武汉市政府、华中科技大学及多家顶尖科研机构联合共建。中心占地约500亩,总投资超过50亿元人民币,旨在构建一个集“计算、存储、网络、数据、算法”于一体的综合性算力服务平台。

1.1 核心硬件设施

  • 超算系统:采用异构计算架构,集成CPU、GPU、FPGA等多种加速单元。核心系统包括:
    • “光谷之芯”:基于最新一代AMD EPYC处理器和NVIDIA H100 GPU集群,提供超过800 PFlops的FP64双精度算力。
    • “未来之眼”:专为AI大模型训练设计的GPU集群,配备超过10,000张NVIDIA H100 GPU,支持万亿参数级模型训练。
    • “量子之桥”:量子计算模拟与混合计算平台,为未来计算范式探索提供实验环境。
  • 存储系统:总存储容量超过100 PB,采用全闪存与分布式存储结合,IOPS(每秒读写次数)高达千万级,满足海量数据处理需求。
  • 网络系统:采用400Gbps InfiniBand和RoCEv2高速网络,实现节点间微秒级延迟通信,确保大规模并行计算效率。

1.2 软件与平台生态

  • 操作系统与调度:基于Linux内核定制优化,采用Slurm、Kubernetes等混合调度系统,支持多租户、多任务并行。
  • 软件栈:预装并优化了主流科学计算软件(如Gaussian、VASP、ANSYS)、AI框架(PyTorch、TensorFlow、JAX)和大数据工具(Spark、Hadoop)。
  • 云服务平台:提供IaaS、PaaS和SaaS层服务,用户可通过Web门户或API调用算力资源,实现“即用即付”。

1.3 应用领域与合作伙伴

中心已服务超过200家科研机构和企业,涵盖:

  • 生命科学:基因测序、蛋白质折叠预测(如AlphaFold2的优化运行)。
  • 材料科学:新材料模拟与设计,如高温超导材料的计算筛选。
  • 人工智能:大语言模型训练、计算机视觉模型优化。
  • 气象与环境:高精度气候模拟、污染物扩散预测。
  • 金融与工程:风险建模、流体动力学仿真。

合作伙伴包括华为、腾讯、百度、中国科学院、清华大学等,共同开展前沿研究。

二、 招聘岗位与职责:寻找改变世界的你

我们本次招聘聚焦于核心研发、系统运维、应用支持和战略规划四大方向,共计开放15个岗位,计划招募30名顶尖人才。所有岗位均提供具有市场竞争力的薪酬(年薪范围:50万-200万人民币,根据资历和岗位定级),并配套股权激励、住房补贴、子女教育等福利。

2.1 核心研发岗位

2.1.1 高性能计算(HPC)软件工程师

  • 岗位职责
    • 开发和优化大规模并行计算程序,支持千万核级并行。
    • 设计并实现新型算法,提升计算效率(如针对GPU的CUDA内核优化)。
    • 参与超算系统软件栈的定制与维护。
  • 任职要求
    • 计算机、数学、物理等相关专业硕士及以上学历。
    • 精通C/C++、Fortran,熟悉MPI、OpenMP、CUDA等并行编程模型。
    • 有HPC应用开发经验者优先(如CFD、MD模拟)。
  • 示例任务:优化一个分子动力学模拟程序(如LAMMPS),使其在GPU集群上的运行速度提升3倍。
    
    // 示例:CUDA内核优化片段(简化版)
    __global__ void compute_forces_kernel(float* positions, float* forces, int N) {
      int idx = blockIdx.x * blockDim.x + threadIdx.x;
      if (idx < N) {
          float fx = 0.0f, fy = 0.0f, fz = 0.0f;
          // 计算粒子间相互作用力(简化Lennard-Jones势)
          for (int j = 0; j < N; j++) {
              if (idx == j) continue;
              float dx = positions[idx*3] - positions[j*3];
              float dy = positions[idx*3+1] - positions[j*3+1];
              float dz = positions[idx*3+2] - positions[j*3+2];
              float r2 = dx*dx + dy*dy + dz*dz;
              float inv_r6 = 1.0f / (r2*r2*r2);
              float force = 24.0f * inv_r6 * (2.0f * inv_r6 - 1.0f) / r2;
              fx += force * dx;
              fy += force * dy;
              fz += force * dz;
          }
          forces[idx*3] = fx;
          forces[idx*3+1] = fy;
          forces[idx*3+2] = fz;
      }
    }
    // 调用示例:在主程序中启动内核
    // compute_forces_kernel<<<grid, block>>>(d_positions, d_forces, N);
    
    通过优化内存访问模式和使用共享内存,可将计算吞吐量提升50%以上。

2.1.2 AI/ML系统架构师

  • 岗位职责

    • 设计并构建大规模AI训练与推理平台,支持多模态模型。
    • 优化分布式训练框架(如PyTorch DDP、DeepSpeed),降低通信开销。
    • 研究新型AI硬件(如TPU、NPU)的集成与调度。
  • 任职要求

    • 计算机科学或人工智能专业博士学历。
    • 精通Python,熟悉TensorFlow/PyTorch生态,有分布式系统设计经验。
    • 发表过顶级会议论文(如NeurIPS、ICML)者优先。
  • 示例任务:设计一个支持10,000张GPU的分布式训练系统,实现千亿参数模型的训练。 “`python

    示例:使用PyTorch DDP进行分布式训练

    import torch import torch.distributed as dist import torch.nn as nn import torch.optim as optim from torch.nn.parallel import DistributedDataParallel as DDP

def setup(rank, world_size):

  # 初始化进程组,使用NCCL后端
  dist.init_process_group("nccl", rank=rank, world_size=world_size)

def train(rank, world_size):

  setup(rank, world_size)
  # 创建模型并移动到GPU
  model = nn.Linear(1024, 1024).to(rank)
  # 使用DDP包装模型
  ddp_model = DDP(model, device_ids=[rank])
  optimizer = optim.Adam(ddp_model.parameters(), lr=1e-4)
  # 模拟数据加载
  data = torch.randn(64, 1024).to(rank)
  target = torch.randn(64, 1024).to(rank)
  # 训练循环
  for epoch in range(10):
      optimizer.zero_grad()
      output = ddp_model(data)
      loss = nn.MSELoss()(output, target)
      loss.backward()
      optimizer.step()
      if rank == 0:
          print(f"Epoch {epoch}, Loss: {loss.item()}")
  dist.destroy_process_group()

# 多进程启动(实际使用torchrun或mpirun) # torchrun –nproc_per_node=8 –nnodes=16 –node_rank=0 –master_addr=master_ip train.py

  通过优化通信策略(如梯度压缩、异步更新),可将训练时间缩短30%。

### 2.2 系统运维岗位
#### 2.2.1 超算系统管理员
- **岗位职责**:
  - 负责超算集群的日常运维、监控与故障排查。
  - 设计并实施高可用性方案,确保系统99.9%以上可用性。
  - 管理用户账户、资源配额和作业调度系统。
- **任职要求**:
  - 计算机或相关专业本科及以上学历,3年以上HPC运维经验。
  - 熟悉Linux系统管理、Shell/Python脚本编写。
  - 掌握Slurm、PBS等作业调度系统。
- **示例任务**:编写一个自动化监控脚本,实时检测GPU温度与利用率。
  ```bash
  # 示例:Bash脚本监控GPU状态
  #!/bin/bash
  # 监控GPU温度、利用率,并发送告警
  while true; do
      # 使用nvidia-smi获取信息
      gpu_info=$(nvidia-smi --query-gpu=temperature.gpu,utilization.gpu --format=csv,noheader,nounits)
      # 解析数据
      IFS=',' read -r temp util <<< "$gpu_info"
      # 检查阈值
      if [ $temp -gt 85 ] || [ $util -gt 95 ]; then
          echo "告警:GPU温度 $temp°C,利用率 $util%" | mail -s "GPU异常" admin@guanggu.com
      fi
      sleep 60  # 每分钟检查一次
  done

通过此脚本,可提前预警硬件故障,减少停机时间。

2.2.2 网络与安全工程师

  • 岗位职责
    • 设计并维护高速网络架构,优化数据传输效率。
    • 实施网络安全策略,防范DDoS攻击和数据泄露。
    • 管理防火墙、VPN和访问控制列表(ACL)。
  • 任职要求
    • 网络工程或信息安全专业本科及以上学历。
    • 熟悉InfiniBand、RoCE网络,有大规模网络部署经验。
    • 持有CISSP、CCIE等认证者优先。

2.3 应用支持岗位

2.3.1 科学计算顾问

  • 岗位职责
    • 为用户提供应用咨询,协助优化计算代码。
    • 开发领域专用工具包(如生物信息学分析流程)。
    • 组织技术培训和研讨会。
  • 任职要求
    • 物理、化学、生物或工程领域博士学历。
    • 熟悉至少一个领域的科学计算软件(如VASP、GROMACS)。
    • 具备良好的沟通能力。

2.3.2 AI应用工程师

  • 岗位职责
    • 帮助用户将AI模型部署到超算平台,提供性能调优服务。
    • 开发AI应用模板,降低用户使用门槛。
    • 参与行业合作项目,解决实际业务问题。
  • 任职要求
    • 计算机或相关专业硕士学历。
    • 熟悉MLOps流程,有模型部署经验(如使用Docker、Kubernetes)。
    • 有医疗、金融或自动驾驶等领域AI应用经验者优先。

2.4 战略规划岗位

2.4.1 算力生态经理

  • 岗位职责
    • 拓展合作伙伴网络,推动超算资源在产业界的应用。
    • 策划算力服务产品,制定市场推广策略。
    • 分析行业趋势,为中心战略规划提供数据支持。
  • 任职要求
    • 商科、计算机或工程专业硕士及以上学历。
    • 5年以上科技行业市场或生态建设经验。
    • 具备优秀的商务谈判和项目管理能力。

三、 薪酬福利:我们承诺最好的回报

我们坚信,顶尖人才值得顶尖回报。薪酬体系基于岗位价值、个人能力和市场水平,确保在行业内具有绝对竞争力。

3.1 薪酬结构

  • 基本年薪:根据岗位和资历,范围如下:
    • 初级工程师(1-3年经验):50万-80万人民币。
    • 中级工程师/顾问(3-8年经验):80万-120万人民币。
    • 高级专家/架构师(8年以上经验):120万-200万人民币。
    • 首席科学家/总监:200万以上,另加股权激励。
  • 绩效奖金:年度绩效奖金可达年薪的20%-50%,与个人和团队目标挂钩。
  • 股权激励:核心岗位提供期权或限制性股票,分享中心长期发展红利。
  • 项目奖金:参与重大科研或产业项目,可获得额外奖励。

3.2 福利体系

  • 住房支持:提供人才公寓或住房补贴(最高50万/年),协助解决子女入学问题。
  • 健康保障:全额缴纳五险一金,补充商业医疗保险(覆盖配偶及子女),年度体检。
  • 职业发展
    • 培训:每年提供不少于20万元的培训经费,支持参加国际会议、在线课程。
    • 晋升:双通道晋升路径(技术专家通道和管理通道),每年两次晋升评审。
    • 学术支持:鼓励发表论文、申请专利,提供科研启动资金。
  • 生活福利
    • 通勤班车、免费工作餐、健身房、心理咨询。
    • 带薪年假20天起,额外带薪病假。
    • 节日礼金、生日福利、团队建设活动。

3.3 工作环境

  • 地点:光谷科学岛,环境优美,配套完善(商业、医疗、教育)。
  • 文化:开放、协作、创新,鼓励试错和持续学习。
  • 灵活性:支持远程办公(每周1-2天),弹性工作时间。

四、 申请流程:加入我们的步骤

我们采用高效、透明的招聘流程,确保每位申请者都能得到及时反馈。

4.1 申请方式

  1. 在线申请:访问光谷科学岛超算中心官网(www.ggsc.com.cn),点击“加入我们”,填写申请表并上传简历。
  2. 邮件申请:发送简历至 careers@ggsc.com.cn,邮件标题注明“应聘岗位-姓名-学历”。
  3. 内推:通过中心员工内推,可获得优先面试机会。

4.2 招聘流程

  1. 简历筛选:HR在3个工作日内完成初筛。
  2. 技术面试:2-3轮技术面试,包括编程测试、系统设计、案例分析。
    • 示例技术问题:设计一个分布式任务调度系统,如何处理节点故障?
      • 考察点:容错机制、状态同步、资源重分配。
      • 参考答案:采用主从架构,主节点监控节点心跳,故障时将任务迁移到备用节点;使用ZooKeeper或etcd实现状态一致性;设计任务检查点机制,支持断点续算。
  3. 综合面试:与部门负责人和HR面试,评估文化匹配度。
  4. Offer发放:通过后1周内发放Offer,协商入职时间。
  5. 入职培训:为期2周的入职培训,涵盖技术栈、安全规范和团队融入。

4.3 时间安排

  • 简历投递截止:2023年12月31日。
  • 面试周期:2024年1月-2月。
  • 入职时间:2024年3月起,可灵活协商。

五、 为什么选择光谷科学岛超算中心?

5.1 技术前沿性

  • 世界级平台:直接操作全球领先的超算系统,接触最前沿的硬件和软件。
  • 创新文化:鼓励探索未知,支持从0到1的创新项目。
  • 学术影响力:与顶尖机构合作,共同发表高水平论文,提升个人学术声誉。

5.2 职业成长空间

  • 快速晋升:年轻人才有机会在3-5年内成为技术骨干或团队负责人。
  • 跨领域机会:参与生命科学、AI、材料等多领域项目,拓宽知识边界。
  • 全球视野:定期与国际专家交流,支持海外访学。

5.3 社会价值

  • 服务国家战略:您的工作将直接支持国家重大科技项目,如“东数西算”工程。
  • 推动产业变革:通过算力赋能,加速生物医药、新能源等产业发展。
  • 培养下一代:参与教育项目,为青少年科普超算知识,传承科技火种。

六、 常见问题解答(FAQ)

Q1:非计算机专业背景可以申请吗? A:可以!我们欢迎物理、化学、生物、工程等领域的专家加入应用支持团队。只要您对计算科学有热情,我们提供培训帮助您快速上手。

Q2:是否有实习机会? A:是的,我们每年招募暑期实习生,优秀实习生可直接获得全职Offer。实习期间提供津贴和导师指导。

Q3:工作强度如何? A:我们倡导高效工作,反对无效加班。通过优化流程和工具,确保团队在合理时间内完成目标。平均每周工作40-45小时。

Q4:如何平衡工作与生活? A:我们提供弹性工作制、远程办公选项,以及丰富的团队活动,帮助员工保持身心健康。

Q5:外地人才如何落户? A:中心协助办理武汉户口,享受人才引进政策(如购房补贴、子女入学优先)。

结语:携手共筑科技未来

光谷科学岛超算中心不仅是技术的殿堂,更是梦想的孵化器。在这里,您将与志同道合的伙伴一起,用算力破解生命密码、预测气候变化、驱动AI革命。我们期待您的加入,共同书写科技史上的新篇章!

立即行动:访问官网或发送邮件,开启您的超算之旅。如有疑问,欢迎致电招聘热线:+86-27-8888-XXXX。

光谷科学岛超算中心,等您来!