Wednesday, October 13, 2010

หลุด 6870 คันใหม่จาก ATI



ขณะที่หลายคนคิดว่าศักยภาพของสถาปัตยกรรมเฟอร์มิจะได้รับการปลดล็อคใน 32nm การออกแบบและด้านล่าง (เช่นการออกแบบ R600 ถูกอื่น ๆ อีกมากมายที่น่ากลัวที่ 55nm กับ 2.5x shaders) ฉันคิดว่ามันเป็น"ความสนุกสนานและท้าทาย"มากขึ้นในการพยายามที่จะคาดเดาว่าสถาปัตยกรรมในปัจจุบันอาจจะ tweaked เพิ่มเติมเกี่ยวกับ 40nm กระบวนการเดียวกันในวันนี้หากไม่มีความวุ่นวายต่อไปฉันจะเริ่มต้น! HD 6870 (กระบวนการ fab 40nm, เหมือนกับ 5870)
HD 6870 (40nm fab process, same as 5870)


900-950 MHz core clock
2000-2400 shaders (up from 1600)
100-120 texture units
32 ROP's (same as 5870)
512-bit memory bus (like HD2900XT)
same-speed GDDR5 memory as 5870, in both 1GB and 2GB versions
การใช้อำนาจสูงสุด 225W สำหรับรุ่น 1GB น้อยกว่า 400 ^ ขนาดตาย 2 (เมื่อเทียบกับ 5870 ของชิป 334mm ^ 2) แน่นอน, เพิ่มประสิทธิภาพการทำงานจะไม่มากเป็นละครที่เป็นจาก 3,870-4,870 (เกี่ยวกับกระบวนการ 55nm เดียวกัน) แต่อาจจะมีค่าต่อไป"จำนวน"รุ่น ขณะนี้สำหรับ Nvidia ... Nvidia ต้องออกแบบสถาปัตยกรรมของพวกเขาอย่างสมบูรณ์ ดีที่พวกเขาได้รับการทำมันสำหรับ"อนุพันธ์"ของสถาปัตยกรรมเฟอร์มิเช่นออกจากหน่วยความแม่นยำสองครั้งและอื่น ๆ ฉันยังจะชอบที่จะพูดคุยเกี่ยวกับ"วิธีการ"สามารถ Nvidia อาจจะทำให้ชิปมีขนาดเล็กเป็น 5870 และยังคงประสิทธิภาพที่ดีภายในซองจดหมายวัตต์เดียวกัน นั่นอาจหมายถึง Nvidia จะต้องตั้ง CUDA กันและจริงๆเรามุ่งเน้นไปที่นักเล่นเกม



"วิธีการให้สามารถวิศวกร Nvidia 334mm ^ 2 ชิปที่เป็นเพียงเร็วที่สุดเท่าที่เป็น 5870 และเช่นเดียวกับที่ใช้พลังงานอย่างมีประสิทธิภาพ?" 512 หน่วย Shader ขวาทั้งหมด 48 ROP 's .. ถ้า 32 ของ ROP จะเป็นวิธีเกินไป bottlenecking แต่ ROP ของใช้เวลานานถึงพื้นที่ขนาดใหญ่ตาย แบนด์วิดธ์หน่วยความจำที่แน่นอนมากขึ้นเป็น GTX 480 มีเพียง 11% แบนด์วิดท์สูงกว่า GTX 285 .. ซึ่งแน่นอนไม่คอขวดสะกดทั่ว GTX 480 ไม่น้อยกว่า TMU ของ GTX 280 แต่อื่น ๆ ! GTX 480 มีเพียง 60 TMU ของเทียบกับ GTX 285 ของ 80 TMU ของ (GTX 480 มีเพียง 42.0 GTexels / s ของ fillrate texel เทียบกับ GTX 285 ของ 51.8 GTexels / s และ 5870 ของ 68.0 GTexels / s!) กับบรรดา 3 พันล้าน trannies fabbed @ 40nm (เกือบ 900 ล้านกว่า 5870) จะต้องมีวิธีการที่วิศวกรของ Nvidia จริงๆเรามุ่งเน้นไปที่เกมมากกว่า แต่เพียงผู้เดียวใน CUDA อย่างไรก็ตามเป็นที่ค่อนข้างชัดเจนว่า Nvidia เป็นจริงพยายามที่จะมุ่งเน้นไปที่ความกล้าหาญ GPGPU เป็นทั้งแก้ปัญหาระยะสั้นและระยะยาวได้รับตำแหน่งระหว่างเอเอ็มดี Radeon และของ Intel ที่จะมาถึง Larabbee (โดยเฉพาะอย่างยิ่งการพิจารณาว่า GPU จะมีแนวโน้มนำไปรวมกับพวกเขาแม้แต่CPU ระดับสูงในอนาคต) เพียงแค่มันสามารถเป็นไปได้ว่าวิศวกรของ Nvidia ขอบของพวกเขาหายไปรอบนี้ (เช่นเดียวกับ ATI และ HD2900XT ของพวกเขา)? ผมขอสงสัยว่าสถาปัตยกรรมเฟอร์มิเคยจะติดต่อกับที่ของ ATI โดยกระบวนการ 22nm 32nm หรือแม้กระทั่งในแง่ของขนาดตายและประหยัดพลังงานประสิทธิภาพชาญฉลาด มันเป็นไปได้สำหรับ Nvidia เพื่อเพียงให้ GPU ที่ถูกออกแบบมาสำหรับ GPGPU, และความแตกต่างกันที่ถูกออกแบบมาสำหรับนักเล่นเกม? ลองดูที่สถาปัตยกรรม G80 และ G92 (และ G90 ที่ไม่เคยเกิดขึ้นมาได้) โดยเพียงการรวมสารพัดของทั้ง G80 และ G92 ผมก็อยากจะบอกว่ามันคล้ายกับสิ่งที่ G90 จะได้รับ G80 มี 24 ROP ของหน่วยความจำบิต 384, 32 TMU ของในขณะที่ G92 64 texels เสนอต่อนาฬิกาแทนเพียง 32 โดยเปรียบเทียบ GTX 480 มีราว 4 เท่า trannies, มีเพียง 2 ครั้ง ROP ของ G80, รถบัส 384 - bit เดียวกันและ 64 ของ TMU การดำเนินการตาม DX11 คนเดียวแน่นอนไม่ได้ใช้เวลานานหลายร้อยล้าน trannies แต่ขอบอกว่ามันจะขึ้นเป็น 200 ล้านบาทเพียงเพื่อประโยชน์ของ heck เฉพาะ shaders มี quadrupled หาก 480 (512) เป็นเวลา 4 ให้มากที่สุดเท่า 128กระบวนการ fab มีหด ๆ จาก 90nm สำหรับชิป G80 เพื่อ 40nm สำหรับชิป GF100 ยักษ์นี้ กว่าด้านสีแดงเราจะเห็นการเปลี่ยนแปลงมาก nicer จาก R600 80nm กำลังหิวและไม่มีประสิทธิภาพเพื่อ R800 40nm เจียมเนื้อเจียมตัว - ยัง - มีประสิทธิภาพ เอเอ็มดีจะรีบขึ้นและเปิดตัวชิปมาก beefier 512 บิตบน 40nm ประมาณ 7-8 เดือนที่ผ่านไประหว่าง 55nm และ 55nm 3870 4870 จะได้รับตอนนี้ 6-7 เดือนนับตั้งแต่ 40nm 5870, และมันจะดีเพื่อดูว่าการจัดตั้งเอเอ็มดีชนิดเดียวกับการปกครองที่ไม่ Nvidia 8800GTX เดียวกับชิปของพวกเขามานาน (หลัง Nvidia แล้วมี"ปกครอง"7950GX2 สำหรับ ไม่กี่เดือนที่แล้ว) อื่น ๆ , เอเอ็มดีจะเสียใจไปตลอดไป 

No comments:

Post a Comment