Giter Site home page Giter Site logo

Comments (5)

shenuiuin avatar shenuiuin commented on July 18, 2024

一、对的,会一直运行,当然也可以关闭容器,你需要的时候开启。退出重启不会重新分配IP
二、恩恩,多人使用多GPU,第一种是可以把全部GPU分配给每个人,每个人能看到所有的显卡,当然这时候就需要协商好,我用前面几块,你用后面几块。第二种的话是每人分配固定的一块,自己只能看到这一块,别人如果分配的是另一块的话也看不到你的。不过这种方法,我还不清楚怎么每个人分配多块。只有一块的话可能不够用,现在我实验室使用的是第一种。靠协商使用。
三、在第二个问题里面,只有当GPU空闲时才能跑,这是实验室的小型服务器,没有考虑到排队。当然也可以自己写shell脚本,当显卡空闲时,自动跑你设置好的代码

from lxd_gpu_server.

sheldon-pan avatar sheldon-pan commented on July 18, 2024

from lxd_gpu_server.

shenuiuin avatar shenuiuin commented on July 18, 2024

from lxd_gpu_server.

llt19903767731 avatar llt19903767731 commented on July 18, 2024

谢谢~ 我现在在做实验室集群的GPU分布式训练来着,也是打算采用容器的样式,不过就想只做成应用容器,docker singularity那种,不用k8s而是用slurm,看看能不能做.不过总体还没有搭起来… 😂 发送自 Windows 10 版邮件<https://go.microsoft.com/fwlink/?LinkId=550986>应用 发件人: shenuiuinmailto:[email protected] 发送时间: 2019年12月26日 19:32 收件人: shenuiuin/LXD_GPU_SERVERmailto:[email protected] 抄送: 晓东mailto:[email protected]; Authormailto:[email protected] 主题: Re: [shenuiuin/LXD_GPU_SERVER] 你好,有一些问题- (#2) 1. 使用这种方式来搭建GPU服务器的话,是否意味着服务器端始终运行所有的容器?如果容器退出重启的话,其IP会重新分配么? 2. 1个容器使用一个GPU核心,另外一个容器能看到该GPU的工作情况么?照理说是不可以的吧,也就是说一个容器分配一个GPU是实现固定好的么? 3. 如何解决GPU的利用率问题,也就是作业排队 谢谢 一、对的,会一直运行,当然也可以关闭容器,你需要的时候开启。退出重启不会重新分配IP 二、恩恩,多人使用多GPU,第一种是可以把全部GPU分配给每个人,每个人能看到所有的显卡,当然这时候就需要协商好,我用前面几块,你用后面几块。第二种的话是每人分配固定的一块,自己只能看到这一块,别人如果分配的是另一块的话也看不到你的。不过这种方法,我还不清楚怎么每个人分配多块。只有一块的话可能不够用,现在我实验室使用的是第一种。靠协商使用。 三、在第二个问题里面,只有当GPU空闲时才能跑,这是实验室的小型服务器,没有考虑到排队。当然也可以自己写shell脚本,当显卡空闲时,自动跑你设置好的代码 — You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#2?email_source=notifications&email_token=AHLGALCPTFPFAC36RXQ2ALLQ2SI5VA5CNFSM4J7ECE32YY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGOEHVOOLI#issuecomment-569042733>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AHLGALGOLJIHXMVEI34WXILQ2SI5VANCNFSM4J7ECE3Q.

你好,有一些问题想和你交流下,可以留个联系方式吗?

from lxd_gpu_server.

shenuiuin avatar shenuiuin commented on July 18, 2024

谢谢~ 我现在在做实验室集群的GPU分布式训练来着,也是打算采用容器的样式,不过就想只做成应用容器,docker singularity那种,不用k8s而是用slurm,看看能不能做.不过总体还没有搭起来… joy 发送自 Windows 10 版邮件<https://go.microsoft.com/fwlink/?LinkId=550986>应用 发件人: shenuiuinmailto:[email protected] 发送时间: 2019年12月26日 19:32 收件人: shenuiuin/LXD_GPU_SERVERmailto:[email protected] 抄送: 晓东mailto:[email protected]; Authormailto:[email protected] 主题: Re: [shenuiuin/LXD_GPU_SERVER] 你好,有一些问题- (#2) 1. 使用这种方式来搭建GPU服务器的话,是否意味着服务器端始终运行所有的容器?如果容器退出重启的话,其IP会重新分配么? 2. 1个容器使用一个GPU核心,另外一个容器能看到该GPU的工作情况么?照理说是不可以的吧,也就是说一个容器分配一个GPU是实现固定好的么? 3. 如何解决GPU的利用率问题,也就是作业排队 谢谢 一、对的,会一直运行,当然也可以关闭容器,你需要的时候开启。退出重启不会重新分配IP 二、恩恩,多人使用多GPU,第一种是可以把全部GPU分配给每个人,每个人能看到所有的显卡,当然这时候就需要协商好,我用前面几块,你用后面几块。第二种的话是每人分配固定的一块,自己只能看到这一块,别人如果分配的是另一块的话也看不到你的。不过这种方法,我还不清楚怎么每个人分配多块。只有一块的话可能不够用,现在我实验室使用的是第一种。靠协商使用。 三、在第二个问题里面,只有当GPU空闲时才能跑,这是实验室的小型服务器,没有考虑到排队。当然也可以自己写shell脚本,当显卡空闲时,自动跑你设置好的代码 — You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#2?email_source=notifications&email_token=AHLGALCPTFPFAC36RXQ2ALLQ2SI5VA5CNFSM4J7ECE32YY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGOEHVOOLI#issuecomment-569042733>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AHLGALGOLJIHXMVEI34WXILQ2SI5VANCNFSM4J7ECE3Q.

你好,有一些问题想和你交流下,可以留个联系方式吗?

可以加我QQ:841463650

from lxd_gpu_server.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.