drivers/gpu/drm/i915/intel_ringbuffer.c at v3.3 · tjh.dev/kernel

tjh.dev / kernel
Linux kernel mirror (for testing) git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git
kernel os linux
kernel / drivers / gpu / drm / i915 / intel_ringbuffer.c
at v3.3 1581 lines 40 kB view raw
   1/*
   2 * Copyright © 2008-2010 Intel Corporation
   3 *
   4 * Permission is hereby granted, free of charge, to any person obtaining a
   5 * copy of this software and associated documentation files (the "Software"),
   6 * to deal in the Software without restriction, including without limitation
   7 * the rights to use, copy, modify, merge, publish, distribute, sublicense,
   8 * and/or sell copies of the Software, and to permit persons to whom the
   9 * Software is furnished to do so, subject to the following conditions:
  10 *
  11 * The above copyright notice and this permission notice (including the next
  12 * paragraph) shall be included in all copies or substantial portions of the
  13 * Software.
  14 *
  15 * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
  16 * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
  17 * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
  18 * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
  19 * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
  20 * FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS
  21 * IN THE SOFTWARE.
  22 *
  23 * Authors:
  24 *    Eric Anholt <eric@anholt.net>
  25 *    Zou Nan hai <nanhai.zou@intel.com>
  26 *    Xiang Hai hao<haihao.xiang@intel.com>
  27 *
  28 */
  29
  30#include "drmP.h"
  31#include "drm.h"
  32#include "i915_drv.h"
  33#include "i915_drm.h"
  34#include "i915_trace.h"
  35#include "intel_drv.h"
  36
  37/*
  38 * 965+ support PIPE_CONTROL commands, which provide finer grained control
  39 * over cache flushing.
  40 */
  41struct pipe_control {
  42	struct drm_i915_gem_object *obj;
  43	volatile u32 *cpu_page;
  44	u32 gtt_offset;
  45};
  46
  47static inline int ring_space(struct intel_ring_buffer *ring)
  48{
  49	int space = (ring->head & HEAD_ADDR) - (ring->tail + 8);
  50	if (space < 0)
  51		space += ring->size;
  52	return space;
  53}
  54
  55static u32 i915_gem_get_seqno(struct drm_device *dev)
  56{
  57	drm_i915_private_t *dev_priv = dev->dev_private;
  58	u32 seqno;
  59
  60	seqno = dev_priv->next_seqno;
  61
  62	/* reserve 0 for non-seqno */
  63	if (++dev_priv->next_seqno == 0)
  64		dev_priv->next_seqno = 1;
  65
  66	return seqno;
  67}
  68
  69static int
  70render_ring_flush(struct intel_ring_buffer *ring,
  71		  u32	invalidate_domains,
  72		  u32	flush_domains)
  73{
  74	struct drm_device *dev = ring->dev;
  75	u32 cmd;
  76	int ret;
  77
  78	/*
  79	 * read/write caches:
  80	 *
  81	 * I915_GEM_DOMAIN_RENDER is always invalidated, but is
  82	 * only flushed if MI_NO_WRITE_FLUSH is unset.  On 965, it is
  83	 * also flushed at 2d versus 3d pipeline switches.
  84	 *
  85	 * read-only caches:
  86	 *
  87	 * I915_GEM_DOMAIN_SAMPLER is flushed on pre-965 if
  88	 * MI_READ_FLUSH is set, and is always flushed on 965.
  89	 *
  90	 * I915_GEM_DOMAIN_COMMAND may not exist?
  91	 *
  92	 * I915_GEM_DOMAIN_INSTRUCTION, which exists on 965, is
  93	 * invalidated when MI_EXE_FLUSH is set.
  94	 *
  95	 * I915_GEM_DOMAIN_VERTEX, which exists on 965, is
  96	 * invalidated with every MI_FLUSH.
  97	 *
  98	 * TLBs:
  99	 *
 100	 * On 965, TLBs associated with I915_GEM_DOMAIN_COMMAND
 101	 * and I915_GEM_DOMAIN_CPU in are invalidated at PTE write and
 102	 * I915_GEM_DOMAIN_RENDER and I915_GEM_DOMAIN_SAMPLER
 103	 * are flushed at any MI_FLUSH.
 104	 */
 105
 106	cmd = MI_FLUSH | MI_NO_WRITE_FLUSH;
 107	if ((invalidate_domains|flush_domains) &
 108	    I915_GEM_DOMAIN_RENDER)
 109		cmd &= ~MI_NO_WRITE_FLUSH;
 110	if (INTEL_INFO(dev)->gen < 4) {
 111		/*
 112		 * On the 965, the sampler cache always gets flushed
 113		 * and this bit is reserved.
 114		 */
 115		if (invalidate_domains & I915_GEM_DOMAIN_SAMPLER)
 116			cmd |= MI_READ_FLUSH;
 117	}
 118	if (invalidate_domains & I915_GEM_DOMAIN_INSTRUCTION)
 119		cmd |= MI_EXE_FLUSH;
 120
 121	if (invalidate_domains & I915_GEM_DOMAIN_COMMAND &&
 122	    (IS_G4X(dev) || IS_GEN5(dev)))
 123		cmd |= MI_INVALIDATE_ISP;
 124
 125	ret = intel_ring_begin(ring, 2);
 126	if (ret)
 127		return ret;
 128
 129	intel_ring_emit(ring, cmd);
 130	intel_ring_emit(ring, MI_NOOP);
 131	intel_ring_advance(ring);
 132
 133	return 0;
 134}
 135
 136/**
 137 * Emits a PIPE_CONTROL with a non-zero post-sync operation, for
 138 * implementing two workarounds on gen6.  From section 1.4.7.1
 139 * "PIPE_CONTROL" of the Sandy Bridge PRM volume 2 part 1:
 140 *
 141 * [DevSNB-C+{W/A}] Before any depth stall flush (including those
 142 * produced by non-pipelined state commands), software needs to first
 143 * send a PIPE_CONTROL with no bits set except Post-Sync Operation !=
 144 * 0.
 145 *
 146 * [Dev-SNB{W/A}]: Before a PIPE_CONTROL with Write Cache Flush Enable
 147 * =1, a PIPE_CONTROL with any non-zero post-sync-op is required.
 148 *
 149 * And the workaround for these two requires this workaround first:
 150 *
 151 * [Dev-SNB{W/A}]: Pipe-control with CS-stall bit set must be sent
 152 * BEFORE the pipe-control with a post-sync op and no write-cache
 153 * flushes.
 154 *
 155 * And this last workaround is tricky because of the requirements on
 156 * that bit.  From section 1.4.7.2.3 "Stall" of the Sandy Bridge PRM
 157 * volume 2 part 1:
 158 *
 159 *     "1 of the following must also be set:
 160 *      - Render Target Cache Flush Enable ([12] of DW1)
 161 *      - Depth Cache Flush Enable ([0] of DW1)
 162 *      - Stall at Pixel Scoreboard ([1] of DW1)
 163 *      - Depth Stall ([13] of DW1)
 164 *      - Post-Sync Operation ([13] of DW1)
 165 *      - Notify Enable ([8] of DW1)"
 166 *
 167 * The cache flushes require the workaround flush that triggered this
 168 * one, so we can't use it.  Depth stall would trigger the same.
 169 * Post-sync nonzero is what triggered this second workaround, so we
 170 * can't use that one either.  Notify enable is IRQs, which aren't
 171 * really our business.  That leaves only stall at scoreboard.
 172 */
 173static int
 174intel_emit_post_sync_nonzero_flush(struct intel_ring_buffer *ring)
 175{
 176	struct pipe_control *pc = ring->private;
 177	u32 scratch_addr = pc->gtt_offset + 128;
 178	int ret;
 179
 180
 181	ret = intel_ring_begin(ring, 6);
 182	if (ret)
 183		return ret;
 184
 185	intel_ring_emit(ring, GFX_OP_PIPE_CONTROL(5));
 186	intel_ring_emit(ring, PIPE_CONTROL_CS_STALL |
 187			PIPE_CONTROL_STALL_AT_SCOREBOARD);
 188	intel_ring_emit(ring, scratch_addr | PIPE_CONTROL_GLOBAL_GTT); /* address */
 189	intel_ring_emit(ring, 0); /* low dword */
 190	intel_ring_emit(ring, 0); /* high dword */
 191	intel_ring_emit(ring, MI_NOOP);
 192	intel_ring_advance(ring);
 193
 194	ret = intel_ring_begin(ring, 6);
 195	if (ret)
 196		return ret;
 197
 198	intel_ring_emit(ring, GFX_OP_PIPE_CONTROL(5));
 199	intel_ring_emit(ring, PIPE_CONTROL_QW_WRITE);
 200	intel_ring_emit(ring, scratch_addr | PIPE_CONTROL_GLOBAL_GTT); /* address */
 201	intel_ring_emit(ring, 0);
 202	intel_ring_emit(ring, 0);
 203	intel_ring_emit(ring, MI_NOOP);
 204	intel_ring_advance(ring);
 205
 206	return 0;
 207}
 208
 209static int
 210gen6_render_ring_flush(struct intel_ring_buffer *ring,
 211                         u32 invalidate_domains, u32 flush_domains)
 212{
 213	u32 flags = 0;
 214	struct pipe_control *pc = ring->private;
 215	u32 scratch_addr = pc->gtt_offset + 128;
 216	int ret;
 217
 218	/* Force SNB workarounds for PIPE_CONTROL flushes */
 219	intel_emit_post_sync_nonzero_flush(ring);
 220
 221	/* Just flush everything.  Experiments have shown that reducing the
 222	 * number of bits based on the write domains has little performance
 223	 * impact.
 224	 */
 225	flags |= PIPE_CONTROL_RENDER_TARGET_CACHE_FLUSH;
 226	flags |= PIPE_CONTROL_INSTRUCTION_CACHE_INVALIDATE;
 227	flags |= PIPE_CONTROL_TEXTURE_CACHE_INVALIDATE;
 228	flags |= PIPE_CONTROL_DEPTH_CACHE_FLUSH;
 229	flags |= PIPE_CONTROL_VF_CACHE_INVALIDATE;
 230	flags |= PIPE_CONTROL_CONST_CACHE_INVALIDATE;
 231	flags |= PIPE_CONTROL_STATE_CACHE_INVALIDATE;
 232
 233	ret = intel_ring_begin(ring, 6);
 234	if (ret)
 235		return ret;
 236
 237	intel_ring_emit(ring, GFX_OP_PIPE_CONTROL(5));
 238	intel_ring_emit(ring, flags);
 239	intel_ring_emit(ring, scratch_addr | PIPE_CONTROL_GLOBAL_GTT);
 240	intel_ring_emit(ring, 0); /* lower dword */
 241	intel_ring_emit(ring, 0); /* uppwer dword */
 242	intel_ring_emit(ring, MI_NOOP);
 243	intel_ring_advance(ring);
 244
 245	return 0;
 246}
 247
 248static void ring_write_tail(struct intel_ring_buffer *ring,
 249			    u32 value)
 250{
 251	drm_i915_private_t *dev_priv = ring->dev->dev_private;
 252	I915_WRITE_TAIL(ring, value);
 253}
 254
 255u32 intel_ring_get_active_head(struct intel_ring_buffer *ring)
 256{
 257	drm_i915_private_t *dev_priv = ring->dev->dev_private;
 258	u32 acthd_reg = INTEL_INFO(ring->dev)->gen >= 4 ?
 259			RING_ACTHD(ring->mmio_base) : ACTHD;
 260
 261	return I915_READ(acthd_reg);
 262}
 263
 264static int init_ring_common(struct intel_ring_buffer *ring)
 265{
 266	drm_i915_private_t *dev_priv = ring->dev->dev_private;
 267	struct drm_i915_gem_object *obj = ring->obj;
 268	u32 head;
 269
 270	/* Stop the ring if it's running. */
 271	I915_WRITE_CTL(ring, 0);
 272	I915_WRITE_HEAD(ring, 0);
 273	ring->write_tail(ring, 0);
 274
 275	/* Initialize the ring. */
 276	I915_WRITE_START(ring, obj->gtt_offset);
 277	head = I915_READ_HEAD(ring) & HEAD_ADDR;
 278
 279	/* G45 ring initialization fails to reset head to zero */
 280	if (head != 0) {
 281		DRM_DEBUG_KMS("%s head not reset to zero "
 282			      "ctl %08x head %08x tail %08x start %08x\n",
 283			      ring->name,
 284			      I915_READ_CTL(ring),
 285			      I915_READ_HEAD(ring),
 286			      I915_READ_TAIL(ring),
 287			      I915_READ_START(ring));
 288
 289		I915_WRITE_HEAD(ring, 0);
 290
 291		if (I915_READ_HEAD(ring) & HEAD_ADDR) {
 292			DRM_ERROR("failed to set %s head to zero "
 293				  "ctl %08x head %08x tail %08x start %08x\n",
 294				  ring->name,
 295				  I915_READ_CTL(ring),
 296				  I915_READ_HEAD(ring),
 297				  I915_READ_TAIL(ring),
 298				  I915_READ_START(ring));
 299		}
 300	}
 301
 302	I915_WRITE_CTL(ring,
 303			((ring->size - PAGE_SIZE) & RING_NR_PAGES)
 304			| RING_VALID);
 305
 306	/* If the head is still not zero, the ring is dead */
 307	if ((I915_READ_CTL(ring) & RING_VALID) == 0 ||
 308	    I915_READ_START(ring) != obj->gtt_offset ||
 309	    (I915_READ_HEAD(ring) & HEAD_ADDR) != 0) {
 310		DRM_ERROR("%s initialization failed "
 311				"ctl %08x head %08x tail %08x start %08x\n",
 312				ring->name,
 313				I915_READ_CTL(ring),
 314				I915_READ_HEAD(ring),
 315				I915_READ_TAIL(ring),
 316				I915_READ_START(ring));
 317		return -EIO;
 318	}
 319
 320	if (!drm_core_check_feature(ring->dev, DRIVER_MODESET))
 321		i915_kernel_lost_context(ring->dev);
 322	else {
 323		ring->head = I915_READ_HEAD(ring);
 324		ring->tail = I915_READ_TAIL(ring) & TAIL_ADDR;
 325		ring->space = ring_space(ring);
 326	}
 327
 328	return 0;
 329}
 330
 331static int
 332init_pipe_control(struct intel_ring_buffer *ring)
 333{
 334	struct pipe_control *pc;
 335	struct drm_i915_gem_object *obj;
 336	int ret;
 337
 338	if (ring->private)
 339		return 0;
 340
 341	pc = kmalloc(sizeof(*pc), GFP_KERNEL);
 342	if (!pc)
 343		return -ENOMEM;
 344
 345	obj = i915_gem_alloc_object(ring->dev, 4096);
 346	if (obj == NULL) {
 347		DRM_ERROR("Failed to allocate seqno page\n");
 348		ret = -ENOMEM;
 349		goto err;
 350	}
 351
 352	i915_gem_object_set_cache_level(obj, I915_CACHE_LLC);
 353
 354	ret = i915_gem_object_pin(obj, 4096, true);
 355	if (ret)
 356		goto err_unref;
 357
 358	pc->gtt_offset = obj->gtt_offset;
 359	pc->cpu_page =  kmap(obj->pages[0]);
 360	if (pc->cpu_page == NULL)
 361		goto err_unpin;
 362
 363	pc->obj = obj;
 364	ring->private = pc;
 365	return 0;
 366
 367err_unpin:
 368	i915_gem_object_unpin(obj);
 369err_unref:
 370	drm_gem_object_unreference(&obj->base);
 371err:
 372	kfree(pc);
 373	return ret;
 374}
 375
 376static void
 377cleanup_pipe_control(struct intel_ring_buffer *ring)
 378{
 379	struct pipe_control *pc = ring->private;
 380	struct drm_i915_gem_object *obj;
 381
 382	if (!ring->private)
 383		return;
 384
 385	obj = pc->obj;
 386	kunmap(obj->pages[0]);
 387	i915_gem_object_unpin(obj);
 388	drm_gem_object_unreference(&obj->base);
 389
 390	kfree(pc);
 391	ring->private = NULL;
 392}
 393
 394static int init_render_ring(struct intel_ring_buffer *ring)
 395{
 396	struct drm_device *dev = ring->dev;
 397	struct drm_i915_private *dev_priv = dev->dev_private;
 398	int ret = init_ring_common(ring);
 399
 400	if (INTEL_INFO(dev)->gen > 3) {
 401		int mode = VS_TIMER_DISPATCH << 16 | VS_TIMER_DISPATCH;
 402		if (IS_GEN6(dev) || IS_GEN7(dev))
 403			mode |= MI_FLUSH_ENABLE << 16 | MI_FLUSH_ENABLE;
 404		I915_WRITE(MI_MODE, mode);
 405		if (IS_GEN7(dev))
 406			I915_WRITE(GFX_MODE_GEN7,
 407				   GFX_MODE_DISABLE(GFX_TLB_INVALIDATE_ALWAYS) |
 408				   GFX_MODE_ENABLE(GFX_REPLAY_MODE));
 409	}
 410
 411	if (INTEL_INFO(dev)->gen >= 5) {
 412		ret = init_pipe_control(ring);
 413		if (ret)
 414			return ret;
 415	}
 416
 417	if (INTEL_INFO(dev)->gen >= 6) {
 418		I915_WRITE(INSTPM,
 419			   INSTPM_FORCE_ORDERING << 16 | INSTPM_FORCE_ORDERING);
 420	}
 421
 422	return ret;
 423}
 424
 425static void render_ring_cleanup(struct intel_ring_buffer *ring)
 426{
 427	if (!ring->private)
 428		return;
 429
 430	cleanup_pipe_control(ring);
 431}
 432
 433static void
 434update_mboxes(struct intel_ring_buffer *ring,
 435	    u32 seqno,
 436	    u32 mmio_offset)
 437{
 438	intel_ring_emit(ring, MI_SEMAPHORE_MBOX |
 439			      MI_SEMAPHORE_GLOBAL_GTT |
 440			      MI_SEMAPHORE_REGISTER |
 441			      MI_SEMAPHORE_UPDATE);
 442	intel_ring_emit(ring, seqno);
 443	intel_ring_emit(ring, mmio_offset);
 444}
 445
 446/**
 447 * gen6_add_request - Update the semaphore mailbox registers
 448 * 
 449 * @ring - ring that is adding a request
 450 * @seqno - return seqno stuck into the ring
 451 *
 452 * Update the mailbox registers in the *other* rings with the current seqno.
 453 * This acts like a signal in the canonical semaphore.
 454 */
 455static int
 456gen6_add_request(struct intel_ring_buffer *ring,
 457		 u32 *seqno)
 458{
 459	u32 mbox1_reg;
 460	u32 mbox2_reg;
 461	int ret;
 462
 463	ret = intel_ring_begin(ring, 10);
 464	if (ret)
 465		return ret;
 466
 467	mbox1_reg = ring->signal_mbox[0];
 468	mbox2_reg = ring->signal_mbox[1];
 469
 470	*seqno = i915_gem_get_seqno(ring->dev);
 471
 472	update_mboxes(ring, *seqno, mbox1_reg);
 473	update_mboxes(ring, *seqno, mbox2_reg);
 474	intel_ring_emit(ring, MI_STORE_DWORD_INDEX);
 475	intel_ring_emit(ring, I915_GEM_HWS_INDEX << MI_STORE_DWORD_INDEX_SHIFT);
 476	intel_ring_emit(ring, *seqno);
 477	intel_ring_emit(ring, MI_USER_INTERRUPT);
 478	intel_ring_advance(ring);
 479
 480	return 0;
 481}
 482
 483/**
 484 * intel_ring_sync - sync the waiter to the signaller on seqno
 485 *
 486 * @waiter - ring that is waiting
 487 * @signaller - ring which has, or will signal
 488 * @seqno - seqno which the waiter will block on
 489 */
 490static int
 491intel_ring_sync(struct intel_ring_buffer *waiter,
 492		struct intel_ring_buffer *signaller,
 493		int ring,
 494		u32 seqno)
 495{
 496	int ret;
 497	u32 dw1 = MI_SEMAPHORE_MBOX |
 498		  MI_SEMAPHORE_COMPARE |
 499		  MI_SEMAPHORE_REGISTER;
 500
 501	ret = intel_ring_begin(waiter, 4);
 502	if (ret)
 503		return ret;
 504
 505	intel_ring_emit(waiter, dw1 | signaller->semaphore_register[ring]);
 506	intel_ring_emit(waiter, seqno);
 507	intel_ring_emit(waiter, 0);
 508	intel_ring_emit(waiter, MI_NOOP);
 509	intel_ring_advance(waiter);
 510
 511	return 0;
 512}
 513
 514/* VCS->RCS (RVSYNC) or BCS->RCS (RBSYNC) */
 515int
 516render_ring_sync_to(struct intel_ring_buffer *waiter,
 517		    struct intel_ring_buffer *signaller,
 518		    u32 seqno)
 519{
 520	WARN_ON(signaller->semaphore_register[RCS] == MI_SEMAPHORE_SYNC_INVALID);
 521	return intel_ring_sync(waiter,
 522			       signaller,
 523			       RCS,
 524			       seqno);
 525}
 526
 527/* RCS->VCS (VRSYNC) or BCS->VCS (VBSYNC) */
 528int
 529gen6_bsd_ring_sync_to(struct intel_ring_buffer *waiter,
 530		      struct intel_ring_buffer *signaller,
 531		      u32 seqno)
 532{
 533	WARN_ON(signaller->semaphore_register[VCS] == MI_SEMAPHORE_SYNC_INVALID);
 534	return intel_ring_sync(waiter,
 535			       signaller,
 536			       VCS,
 537			       seqno);
 538}
 539
 540/* RCS->BCS (BRSYNC) or VCS->BCS (BVSYNC) */
 541int
 542gen6_blt_ring_sync_to(struct intel_ring_buffer *waiter,
 543		      struct intel_ring_buffer *signaller,
 544		      u32 seqno)
 545{
 546	WARN_ON(signaller->semaphore_register[BCS] == MI_SEMAPHORE_SYNC_INVALID);
 547	return intel_ring_sync(waiter,
 548			       signaller,
 549			       BCS,
 550			       seqno);
 551}
 552
 553
 554
 555#define PIPE_CONTROL_FLUSH(ring__, addr__)					\
 556do {									\
 557	intel_ring_emit(ring__, GFX_OP_PIPE_CONTROL(4) | PIPE_CONTROL_QW_WRITE |		\
 558		 PIPE_CONTROL_DEPTH_STALL);				\
 559	intel_ring_emit(ring__, (addr__) | PIPE_CONTROL_GLOBAL_GTT);			\
 560	intel_ring_emit(ring__, 0);							\
 561	intel_ring_emit(ring__, 0);							\
 562} while (0)
 563
 564static int
 565pc_render_add_request(struct intel_ring_buffer *ring,
 566		      u32 *result)
 567{
 568	struct drm_device *dev = ring->dev;
 569	u32 seqno = i915_gem_get_seqno(dev);
 570	struct pipe_control *pc = ring->private;
 571	u32 scratch_addr = pc->gtt_offset + 128;
 572	int ret;
 573
 574	/* For Ironlake, MI_USER_INTERRUPT was deprecated and apparently
 575	 * incoherent with writes to memory, i.e. completely fubar,
 576	 * so we need to use PIPE_NOTIFY instead.
 577	 *
 578	 * However, we also need to workaround the qword write
 579	 * incoherence by flushing the 6 PIPE_NOTIFY buffers out to
 580	 * memory before requesting an interrupt.
 581	 */
 582	ret = intel_ring_begin(ring, 32);
 583	if (ret)
 584		return ret;
 585
 586	intel_ring_emit(ring, GFX_OP_PIPE_CONTROL(4) | PIPE_CONTROL_QW_WRITE |
 587			PIPE_CONTROL_WRITE_FLUSH |
 588			PIPE_CONTROL_TEXTURE_CACHE_INVALIDATE);
 589	intel_ring_emit(ring, pc->gtt_offset | PIPE_CONTROL_GLOBAL_GTT);
 590	intel_ring_emit(ring, seqno);
 591	intel_ring_emit(ring, 0);
 592	PIPE_CONTROL_FLUSH(ring, scratch_addr);
 593	scratch_addr += 128; /* write to separate cachelines */
 594	PIPE_CONTROL_FLUSH(ring, scratch_addr);
 595	scratch_addr += 128;
 596	PIPE_CONTROL_FLUSH(ring, scratch_addr);
 597	scratch_addr += 128;
 598	PIPE_CONTROL_FLUSH(ring, scratch_addr);
 599	scratch_addr += 128;
 600	PIPE_CONTROL_FLUSH(ring, scratch_addr);
 601	scratch_addr += 128;
 602	PIPE_CONTROL_FLUSH(ring, scratch_addr);
 603	intel_ring_emit(ring, GFX_OP_PIPE_CONTROL(4) | PIPE_CONTROL_QW_WRITE |
 604			PIPE_CONTROL_WRITE_FLUSH |
 605			PIPE_CONTROL_TEXTURE_CACHE_INVALIDATE |
 606			PIPE_CONTROL_NOTIFY);
 607	intel_ring_emit(ring, pc->gtt_offset | PIPE_CONTROL_GLOBAL_GTT);
 608	intel_ring_emit(ring, seqno);
 609	intel_ring_emit(ring, 0);
 610	intel_ring_advance(ring);
 611
 612	*result = seqno;
 613	return 0;
 614}
 615
 616static int
 617render_ring_add_request(struct intel_ring_buffer *ring,
 618			u32 *result)
 619{
 620	struct drm_device *dev = ring->dev;
 621	u32 seqno = i915_gem_get_seqno(dev);
 622	int ret;
 623
 624	ret = intel_ring_begin(ring, 4);
 625	if (ret)
 626		return ret;
 627
 628	intel_ring_emit(ring, MI_STORE_DWORD_INDEX);
 629	intel_ring_emit(ring, I915_GEM_HWS_INDEX << MI_STORE_DWORD_INDEX_SHIFT);
 630	intel_ring_emit(ring, seqno);
 631	intel_ring_emit(ring, MI_USER_INTERRUPT);
 632	intel_ring_advance(ring);
 633
 634	*result = seqno;
 635	return 0;
 636}
 637
 638static u32
 639gen6_ring_get_seqno(struct intel_ring_buffer *ring)
 640{
 641	struct drm_device *dev = ring->dev;
 642
 643	/* Workaround to force correct ordering between irq and seqno writes on
 644	 * ivb (and maybe also on snb) by reading from a CS register (like
 645	 * ACTHD) before reading the status page. */
 646	if (IS_GEN7(dev))
 647		intel_ring_get_active_head(ring);
 648	return intel_read_status_page(ring, I915_GEM_HWS_INDEX);
 649}
 650
 651static u32
 652ring_get_seqno(struct intel_ring_buffer *ring)
 653{
 654	return intel_read_status_page(ring, I915_GEM_HWS_INDEX);
 655}
 656
 657static u32
 658pc_render_get_seqno(struct intel_ring_buffer *ring)
 659{
 660	struct pipe_control *pc = ring->private;
 661	return pc->cpu_page[0];
 662}
 663
 664static void
 665ironlake_enable_irq(drm_i915_private_t *dev_priv, u32 mask)
 666{
 667	dev_priv->gt_irq_mask &= ~mask;
 668	I915_WRITE(GTIMR, dev_priv->gt_irq_mask);
 669	POSTING_READ(GTIMR);
 670}
 671
 672static void
 673ironlake_disable_irq(drm_i915_private_t *dev_priv, u32 mask)
 674{
 675	dev_priv->gt_irq_mask |= mask;
 676	I915_WRITE(GTIMR, dev_priv->gt_irq_mask);
 677	POSTING_READ(GTIMR);
 678}
 679
 680static void
 681i915_enable_irq(drm_i915_private_t *dev_priv, u32 mask)
 682{
 683	dev_priv->irq_mask &= ~mask;
 684	I915_WRITE(IMR, dev_priv->irq_mask);
 685	POSTING_READ(IMR);
 686}
 687
 688static void
 689i915_disable_irq(drm_i915_private_t *dev_priv, u32 mask)
 690{
 691	dev_priv->irq_mask |= mask;
 692	I915_WRITE(IMR, dev_priv->irq_mask);
 693	POSTING_READ(IMR);
 694}
 695
 696static bool
 697render_ring_get_irq(struct intel_ring_buffer *ring)
 698{
 699	struct drm_device *dev = ring->dev;
 700	drm_i915_private_t *dev_priv = dev->dev_private;
 701
 702	if (!dev->irq_enabled)
 703		return false;
 704
 705	spin_lock(&ring->irq_lock);
 706	if (ring->irq_refcount++ == 0) {
 707		if (HAS_PCH_SPLIT(dev))
 708			ironlake_enable_irq(dev_priv,
 709					    GT_PIPE_NOTIFY | GT_USER_INTERRUPT);
 710		else
 711			i915_enable_irq(dev_priv, I915_USER_INTERRUPT);
 712	}
 713	spin_unlock(&ring->irq_lock);
 714
 715	return true;
 716}
 717
 718static void
 719render_ring_put_irq(struct intel_ring_buffer *ring)
 720{
 721	struct drm_device *dev = ring->dev;
 722	drm_i915_private_t *dev_priv = dev->dev_private;
 723
 724	spin_lock(&ring->irq_lock);
 725	if (--ring->irq_refcount == 0) {
 726		if (HAS_PCH_SPLIT(dev))
 727			ironlake_disable_irq(dev_priv,
 728					     GT_USER_INTERRUPT |
 729					     GT_PIPE_NOTIFY);
 730		else
 731			i915_disable_irq(dev_priv, I915_USER_INTERRUPT);
 732	}
 733	spin_unlock(&ring->irq_lock);
 734}
 735
 736void intel_ring_setup_status_page(struct intel_ring_buffer *ring)
 737{
 738	struct drm_device *dev = ring->dev;
 739	drm_i915_private_t *dev_priv = ring->dev->dev_private;
 740	u32 mmio = 0;
 741
 742	/* The ring status page addresses are no longer next to the rest of
 743	 * the ring registers as of gen7.
 744	 */
 745	if (IS_GEN7(dev)) {
 746		switch (ring->id) {
 747		case RING_RENDER:
 748			mmio = RENDER_HWS_PGA_GEN7;
 749			break;
 750		case RING_BLT:
 751			mmio = BLT_HWS_PGA_GEN7;
 752			break;
 753		case RING_BSD:
 754			mmio = BSD_HWS_PGA_GEN7;
 755			break;
 756		}
 757	} else if (IS_GEN6(ring->dev)) {
 758		mmio = RING_HWS_PGA_GEN6(ring->mmio_base);
 759	} else {
 760		mmio = RING_HWS_PGA(ring->mmio_base);
 761	}
 762
 763	I915_WRITE(mmio, (u32)ring->status_page.gfx_addr);
 764	POSTING_READ(mmio);
 765}
 766
 767static int
 768bsd_ring_flush(struct intel_ring_buffer *ring,
 769	       u32     invalidate_domains,
 770	       u32     flush_domains)
 771{
 772	int ret;
 773
 774	ret = intel_ring_begin(ring, 2);
 775	if (ret)
 776		return ret;
 777
 778	intel_ring_emit(ring, MI_FLUSH);
 779	intel_ring_emit(ring, MI_NOOP);
 780	intel_ring_advance(ring);
 781	return 0;
 782}
 783
 784static int
 785ring_add_request(struct intel_ring_buffer *ring,
 786		 u32 *result)
 787{
 788	u32 seqno;
 789	int ret;
 790
 791	ret = intel_ring_begin(ring, 4);
 792	if (ret)
 793		return ret;
 794
 795	seqno = i915_gem_get_seqno(ring->dev);
 796
 797	intel_ring_emit(ring, MI_STORE_DWORD_INDEX);
 798	intel_ring_emit(ring, I915_GEM_HWS_INDEX << MI_STORE_DWORD_INDEX_SHIFT);
 799	intel_ring_emit(ring, seqno);
 800	intel_ring_emit(ring, MI_USER_INTERRUPT);
 801	intel_ring_advance(ring);
 802
 803	*result = seqno;
 804	return 0;
 805}
 806
 807static bool
 808gen6_ring_get_irq(struct intel_ring_buffer *ring, u32 gflag, u32 rflag)
 809{
 810	struct drm_device *dev = ring->dev;
 811	drm_i915_private_t *dev_priv = dev->dev_private;
 812
 813	if (!dev->irq_enabled)
 814	       return false;
 815
 816	/* It looks like we need to prevent the gt from suspending while waiting
 817	 * for an notifiy irq, otherwise irqs seem to get lost on at least the
 818	 * blt/bsd rings on ivb. */
 819	if (IS_GEN7(dev))
 820		gen6_gt_force_wake_get(dev_priv);
 821
 822	spin_lock(&ring->irq_lock);
 823	if (ring->irq_refcount++ == 0) {
 824		ring->irq_mask &= ~rflag;
 825		I915_WRITE_IMR(ring, ring->irq_mask);
 826		ironlake_enable_irq(dev_priv, gflag);
 827	}
 828	spin_unlock(&ring->irq_lock);
 829
 830	return true;
 831}
 832
 833static void
 834gen6_ring_put_irq(struct intel_ring_buffer *ring, u32 gflag, u32 rflag)
 835{
 836	struct drm_device *dev = ring->dev;
 837	drm_i915_private_t *dev_priv = dev->dev_private;
 838
 839	spin_lock(&ring->irq_lock);
 840	if (--ring->irq_refcount == 0) {
 841		ring->irq_mask |= rflag;
 842		I915_WRITE_IMR(ring, ring->irq_mask);
 843		ironlake_disable_irq(dev_priv, gflag);
 844	}
 845	spin_unlock(&ring->irq_lock);
 846
 847	if (IS_GEN7(dev))
 848		gen6_gt_force_wake_put(dev_priv);
 849}
 850
 851static bool
 852bsd_ring_get_irq(struct intel_ring_buffer *ring)
 853{
 854	struct drm_device *dev = ring->dev;
 855	drm_i915_private_t *dev_priv = dev->dev_private;
 856
 857	if (!dev->irq_enabled)
 858		return false;
 859
 860	spin_lock(&ring->irq_lock);
 861	if (ring->irq_refcount++ == 0) {
 862		if (IS_G4X(dev))
 863			i915_enable_irq(dev_priv, I915_BSD_USER_INTERRUPT);
 864		else
 865			ironlake_enable_irq(dev_priv, GT_BSD_USER_INTERRUPT);
 866	}
 867	spin_unlock(&ring->irq_lock);
 868
 869	return true;
 870}
 871static void
 872bsd_ring_put_irq(struct intel_ring_buffer *ring)
 873{
 874	struct drm_device *dev = ring->dev;
 875	drm_i915_private_t *dev_priv = dev->dev_private;
 876
 877	spin_lock(&ring->irq_lock);
 878	if (--ring->irq_refcount == 0) {
 879		if (IS_G4X(dev))
 880			i915_disable_irq(dev_priv, I915_BSD_USER_INTERRUPT);
 881		else
 882			ironlake_disable_irq(dev_priv, GT_BSD_USER_INTERRUPT);
 883	}
 884	spin_unlock(&ring->irq_lock);
 885}
 886
 887static int
 888ring_dispatch_execbuffer(struct intel_ring_buffer *ring, u32 offset, u32 length)
 889{
 890	int ret;
 891
 892	ret = intel_ring_begin(ring, 2);
 893	if (ret)
 894		return ret;
 895
 896	intel_ring_emit(ring,
 897			MI_BATCH_BUFFER_START | (2 << 6) |
 898			MI_BATCH_NON_SECURE_I965);
 899	intel_ring_emit(ring, offset);
 900	intel_ring_advance(ring);
 901
 902	return 0;
 903}
 904
 905static int
 906render_ring_dispatch_execbuffer(struct intel_ring_buffer *ring,
 907				u32 offset, u32 len)
 908{
 909	struct drm_device *dev = ring->dev;
 910	int ret;
 911
 912	if (IS_I830(dev) || IS_845G(dev)) {
 913		ret = intel_ring_begin(ring, 4);
 914		if (ret)
 915			return ret;
 916
 917		intel_ring_emit(ring, MI_BATCH_BUFFER);
 918		intel_ring_emit(ring, offset | MI_BATCH_NON_SECURE);
 919		intel_ring_emit(ring, offset + len - 8);
 920		intel_ring_emit(ring, 0);
 921	} else {
 922		ret = intel_ring_begin(ring, 2);
 923		if (ret)
 924			return ret;
 925
 926		if (INTEL_INFO(dev)->gen >= 4) {
 927			intel_ring_emit(ring,
 928					MI_BATCH_BUFFER_START | (2 << 6) |
 929					MI_BATCH_NON_SECURE_I965);
 930			intel_ring_emit(ring, offset);
 931		} else {
 932			intel_ring_emit(ring,
 933					MI_BATCH_BUFFER_START | (2 << 6));
 934			intel_ring_emit(ring, offset | MI_BATCH_NON_SECURE);
 935		}
 936	}
 937	intel_ring_advance(ring);
 938
 939	return 0;
 940}
 941
 942static void cleanup_status_page(struct intel_ring_buffer *ring)
 943{
 944	drm_i915_private_t *dev_priv = ring->dev->dev_private;
 945	struct drm_i915_gem_object *obj;
 946
 947	obj = ring->status_page.obj;
 948	if (obj == NULL)
 949		return;
 950
 951	kunmap(obj->pages[0]);
 952	i915_gem_object_unpin(obj);
 953	drm_gem_object_unreference(&obj->base);
 954	ring->status_page.obj = NULL;
 955
 956	memset(&dev_priv->hws_map, 0, sizeof(dev_priv->hws_map));
 957}
 958
 959static int init_status_page(struct intel_ring_buffer *ring)
 960{
 961	struct drm_device *dev = ring->dev;
 962	drm_i915_private_t *dev_priv = dev->dev_private;
 963	struct drm_i915_gem_object *obj;
 964	int ret;
 965
 966	obj = i915_gem_alloc_object(dev, 4096);
 967	if (obj == NULL) {
 968		DRM_ERROR("Failed to allocate status page\n");
 969		ret = -ENOMEM;
 970		goto err;
 971	}
 972
 973	i915_gem_object_set_cache_level(obj, I915_CACHE_LLC);
 974
 975	ret = i915_gem_object_pin(obj, 4096, true);
 976	if (ret != 0) {
 977		goto err_unref;
 978	}
 979
 980	ring->status_page.gfx_addr = obj->gtt_offset;
 981	ring->status_page.page_addr = kmap(obj->pages[0]);
 982	if (ring->status_page.page_addr == NULL) {
 983		memset(&dev_priv->hws_map, 0, sizeof(dev_priv->hws_map));
 984		goto err_unpin;
 985	}
 986	ring->status_page.obj = obj;
 987	memset(ring->status_page.page_addr, 0, PAGE_SIZE);
 988
 989	intel_ring_setup_status_page(ring);
 990	DRM_DEBUG_DRIVER("%s hws offset: 0x%08x\n",
 991			ring->name, ring->status_page.gfx_addr);
 992
 993	return 0;
 994
 995err_unpin:
 996	i915_gem_object_unpin(obj);
 997err_unref:
 998	drm_gem_object_unreference(&obj->base);
 999err:
1000	return ret;
1001}
1002
1003int intel_init_ring_buffer(struct drm_device *dev,
1004			   struct intel_ring_buffer *ring)
1005{
1006	struct drm_i915_gem_object *obj;
1007	int ret;
1008
1009	ring->dev = dev;
1010	INIT_LIST_HEAD(&ring->active_list);
1011	INIT_LIST_HEAD(&ring->request_list);
1012	INIT_LIST_HEAD(&ring->gpu_write_list);
1013
1014	init_waitqueue_head(&ring->irq_queue);
1015	spin_lock_init(&ring->irq_lock);
1016	ring->irq_mask = ~0;
1017
1018	if (I915_NEED_GFX_HWS(dev)) {
1019		ret = init_status_page(ring);
1020		if (ret)
1021			return ret;
1022	}
1023
1024	obj = i915_gem_alloc_object(dev, ring->size);
1025	if (obj == NULL) {
1026		DRM_ERROR("Failed to allocate ringbuffer\n");
1027		ret = -ENOMEM;
1028		goto err_hws;
1029	}
1030
1031	ring->obj = obj;
1032
1033	ret = i915_gem_object_pin(obj, PAGE_SIZE, true);
1034	if (ret)
1035		goto err_unref;
1036
1037	ring->map.size = ring->size;
1038	ring->map.offset = dev->agp->base + obj->gtt_offset;
1039	ring->map.type = 0;
1040	ring->map.flags = 0;
1041	ring->map.mtrr = 0;
1042
1043	drm_core_ioremap_wc(&ring->map, dev);
1044	if (ring->map.handle == NULL) {
1045		DRM_ERROR("Failed to map ringbuffer.\n");
1046		ret = -EINVAL;
1047		goto err_unpin;
1048	}
1049
1050	ring->virtual_start = ring->map.handle;
1051	ret = ring->init(ring);
1052	if (ret)
1053		goto err_unmap;
1054
1055	/* Workaround an erratum on the i830 which causes a hang if
1056	 * the TAIL pointer points to within the last 2 cachelines
1057	 * of the buffer.
1058	 */
1059	ring->effective_size = ring->size;
1060	if (IS_I830(ring->dev))
1061		ring->effective_size -= 128;
1062
1063	return 0;
1064
1065err_unmap:
1066	drm_core_ioremapfree(&ring->map, dev);
1067err_unpin:
1068	i915_gem_object_unpin(obj);
1069err_unref:
1070	drm_gem_object_unreference(&obj->base);
1071	ring->obj = NULL;
1072err_hws:
1073	cleanup_status_page(ring);
1074	return ret;
1075}
1076
1077void intel_cleanup_ring_buffer(struct intel_ring_buffer *ring)
1078{
1079	struct drm_i915_private *dev_priv;
1080	int ret;
1081
1082	if (ring->obj == NULL)
1083		return;
1084
1085	/* Disable the ring buffer. The ring must be idle at this point */
1086	dev_priv = ring->dev->dev_private;
1087	ret = intel_wait_ring_idle(ring);
1088	if (ret)
1089		DRM_ERROR("failed to quiesce %s whilst cleaning up: %d\n",
1090			  ring->name, ret);
1091
1092	I915_WRITE_CTL(ring, 0);
1093
1094	drm_core_ioremapfree(&ring->map, ring->dev);
1095
1096	i915_gem_object_unpin(ring->obj);
1097	drm_gem_object_unreference(&ring->obj->base);
1098	ring->obj = NULL;
1099
1100	if (ring->cleanup)
1101		ring->cleanup(ring);
1102
1103	cleanup_status_page(ring);
1104}
1105
1106static int intel_wrap_ring_buffer(struct intel_ring_buffer *ring)
1107{
1108	unsigned int *virt;
1109	int rem = ring->size - ring->tail;
1110
1111	if (ring->space < rem) {
1112		int ret = intel_wait_ring_buffer(ring, rem);
1113		if (ret)
1114			return ret;
1115	}
1116
1117	virt = (unsigned int *)(ring->virtual_start + ring->tail);
1118	rem /= 8;
1119	while (rem--) {
1120		*virt++ = MI_NOOP;
1121		*virt++ = MI_NOOP;
1122	}
1123
1124	ring->tail = 0;
1125	ring->space = ring_space(ring);
1126
1127	return 0;
1128}
1129
1130int intel_wait_ring_buffer(struct intel_ring_buffer *ring, int n)
1131{
1132	struct drm_device *dev = ring->dev;
1133	struct drm_i915_private *dev_priv = dev->dev_private;
1134	unsigned long end;
1135
1136	trace_i915_ring_wait_begin(ring);
1137	if (drm_core_check_feature(dev, DRIVER_GEM))
1138		/* With GEM the hangcheck timer should kick us out of the loop,
1139		 * leaving it early runs the risk of corrupting GEM state (due
1140		 * to running on almost untested codepaths). But on resume
1141		 * timers don't work yet, so prevent a complete hang in that
1142		 * case by choosing an insanely large timeout. */
1143		end = jiffies + 60 * HZ;
1144	else
1145		end = jiffies + 3 * HZ;
1146
1147	do {
1148		ring->head = I915_READ_HEAD(ring);
1149		ring->space = ring_space(ring);
1150		if (ring->space >= n) {
1151			trace_i915_ring_wait_end(ring);
1152			return 0;
1153		}
1154
1155		if (dev->primary->master) {
1156			struct drm_i915_master_private *master_priv = dev->primary->master->driver_priv;
1157			if (master_priv->sarea_priv)
1158				master_priv->sarea_priv->perf_boxes |= I915_BOX_WAIT;
1159		}
1160
1161		msleep(1);
1162		if (atomic_read(&dev_priv->mm.wedged))
1163			return -EAGAIN;
1164	} while (!time_after(jiffies, end));
1165	trace_i915_ring_wait_end(ring);
1166	return -EBUSY;
1167}
1168
1169int intel_ring_begin(struct intel_ring_buffer *ring,
1170		     int num_dwords)
1171{
1172	struct drm_i915_private *dev_priv = ring->dev->dev_private;
1173	int n = 4*num_dwords;
1174	int ret;
1175
1176	if (unlikely(atomic_read(&dev_priv->mm.wedged)))
1177		return -EIO;
1178
1179	if (unlikely(ring->tail + n > ring->effective_size)) {
1180		ret = intel_wrap_ring_buffer(ring);
1181		if (unlikely(ret))
1182			return ret;
1183	}
1184
1185	if (unlikely(ring->space < n)) {
1186		ret = intel_wait_ring_buffer(ring, n);
1187		if (unlikely(ret))
1188			return ret;
1189	}
1190
1191	ring->space -= n;
1192	return 0;
1193}
1194
1195void intel_ring_advance(struct intel_ring_buffer *ring)
1196{
1197	ring->tail &= ring->size - 1;
1198	ring->write_tail(ring, ring->tail);
1199}
1200
1201static const struct intel_ring_buffer render_ring = {
1202	.name			= "render ring",
1203	.id			= RING_RENDER,
1204	.mmio_base		= RENDER_RING_BASE,
1205	.size			= 32 * PAGE_SIZE,
1206	.init			= init_render_ring,
1207	.write_tail		= ring_write_tail,
1208	.flush			= render_ring_flush,
1209	.add_request		= render_ring_add_request,
1210	.get_seqno		= ring_get_seqno,
1211	.irq_get		= render_ring_get_irq,
1212	.irq_put		= render_ring_put_irq,
1213	.dispatch_execbuffer	= render_ring_dispatch_execbuffer,
1214	.cleanup		= render_ring_cleanup,
1215	.sync_to		= render_ring_sync_to,
1216	.semaphore_register	= {MI_SEMAPHORE_SYNC_INVALID,
1217				   MI_SEMAPHORE_SYNC_RV,
1218				   MI_SEMAPHORE_SYNC_RB},
1219	.signal_mbox		= {GEN6_VRSYNC, GEN6_BRSYNC},
1220};
1221
1222/* ring buffer for bit-stream decoder */
1223
1224static const struct intel_ring_buffer bsd_ring = {
1225	.name                   = "bsd ring",
1226	.id			= RING_BSD,
1227	.mmio_base		= BSD_RING_BASE,
1228	.size			= 32 * PAGE_SIZE,
1229	.init			= init_ring_common,
1230	.write_tail		= ring_write_tail,
1231	.flush			= bsd_ring_flush,
1232	.add_request		= ring_add_request,
1233	.get_seqno		= ring_get_seqno,
1234	.irq_get		= bsd_ring_get_irq,
1235	.irq_put		= bsd_ring_put_irq,
1236	.dispatch_execbuffer	= ring_dispatch_execbuffer,
1237};
1238
1239
1240static void gen6_bsd_ring_write_tail(struct intel_ring_buffer *ring,
1241				     u32 value)
1242{
1243	drm_i915_private_t *dev_priv = ring->dev->dev_private;
1244
1245       /* Every tail move must follow the sequence below */
1246	I915_WRITE(GEN6_BSD_SLEEP_PSMI_CONTROL,
1247		GEN6_BSD_SLEEP_PSMI_CONTROL_RC_ILDL_MESSAGE_MODIFY_MASK |
1248		GEN6_BSD_SLEEP_PSMI_CONTROL_RC_ILDL_MESSAGE_DISABLE);
1249	I915_WRITE(GEN6_BSD_RNCID, 0x0);
1250
1251	if (wait_for((I915_READ(GEN6_BSD_SLEEP_PSMI_CONTROL) &
1252		GEN6_BSD_SLEEP_PSMI_CONTROL_IDLE_INDICATOR) == 0,
1253		50))
1254	DRM_ERROR("timed out waiting for IDLE Indicator\n");
1255
1256	I915_WRITE_TAIL(ring, value);
1257	I915_WRITE(GEN6_BSD_SLEEP_PSMI_CONTROL,
1258		GEN6_BSD_SLEEP_PSMI_CONTROL_RC_ILDL_MESSAGE_MODIFY_MASK |
1259		GEN6_BSD_SLEEP_PSMI_CONTROL_RC_ILDL_MESSAGE_ENABLE);
1260}
1261
1262static int gen6_ring_flush(struct intel_ring_buffer *ring,
1263			   u32 invalidate, u32 flush)
1264{
1265	uint32_t cmd;
1266	int ret;
1267
1268	ret = intel_ring_begin(ring, 4);
1269	if (ret)
1270		return ret;
1271
1272	cmd = MI_FLUSH_DW;
1273	if (invalidate & I915_GEM_GPU_DOMAINS)
1274		cmd |= MI_INVALIDATE_TLB | MI_INVALIDATE_BSD;
1275	intel_ring_emit(ring, cmd);
1276	intel_ring_emit(ring, 0);
1277	intel_ring_emit(ring, 0);
1278	intel_ring_emit(ring, MI_NOOP);
1279	intel_ring_advance(ring);
1280	return 0;
1281}
1282
1283static int
1284gen6_ring_dispatch_execbuffer(struct intel_ring_buffer *ring,
1285			      u32 offset, u32 len)
1286{
1287	int ret;
1288
1289	ret = intel_ring_begin(ring, 2);
1290	if (ret)
1291		return ret;
1292
1293	intel_ring_emit(ring, MI_BATCH_BUFFER_START | MI_BATCH_NON_SECURE_I965);
1294	/* bit0-7 is the length on GEN6+ */
1295	intel_ring_emit(ring, offset);
1296	intel_ring_advance(ring);
1297
1298	return 0;
1299}
1300
1301static bool
1302gen6_render_ring_get_irq(struct intel_ring_buffer *ring)
1303{
1304	return gen6_ring_get_irq(ring,
1305				 GT_USER_INTERRUPT,
1306				 GEN6_RENDER_USER_INTERRUPT);
1307}
1308
1309static void
1310gen6_render_ring_put_irq(struct intel_ring_buffer *ring)
1311{
1312	return gen6_ring_put_irq(ring,
1313				 GT_USER_INTERRUPT,
1314				 GEN6_RENDER_USER_INTERRUPT);
1315}
1316
1317static bool
1318gen6_bsd_ring_get_irq(struct intel_ring_buffer *ring)
1319{
1320	return gen6_ring_get_irq(ring,
1321				 GT_GEN6_BSD_USER_INTERRUPT,
1322				 GEN6_BSD_USER_INTERRUPT);
1323}
1324
1325static void
1326gen6_bsd_ring_put_irq(struct intel_ring_buffer *ring)
1327{
1328	return gen6_ring_put_irq(ring,
1329				 GT_GEN6_BSD_USER_INTERRUPT,
1330				 GEN6_BSD_USER_INTERRUPT);
1331}
1332
1333/* ring buffer for Video Codec for Gen6+ */
1334static const struct intel_ring_buffer gen6_bsd_ring = {
1335	.name			= "gen6 bsd ring",
1336	.id			= RING_BSD,
1337	.mmio_base		= GEN6_BSD_RING_BASE,
1338	.size			= 32 * PAGE_SIZE,
1339	.init			= init_ring_common,
1340	.write_tail		= gen6_bsd_ring_write_tail,
1341	.flush			= gen6_ring_flush,
1342	.add_request		= gen6_add_request,
1343	.get_seqno		= gen6_ring_get_seqno,
1344	.irq_get		= gen6_bsd_ring_get_irq,
1345	.irq_put		= gen6_bsd_ring_put_irq,
1346	.dispatch_execbuffer	= gen6_ring_dispatch_execbuffer,
1347	.sync_to		= gen6_bsd_ring_sync_to,
1348	.semaphore_register	= {MI_SEMAPHORE_SYNC_VR,
1349				   MI_SEMAPHORE_SYNC_INVALID,
1350				   MI_SEMAPHORE_SYNC_VB},
1351	.signal_mbox		= {GEN6_RVSYNC, GEN6_BVSYNC},
1352};
1353
1354/* Blitter support (SandyBridge+) */
1355
1356static bool
1357blt_ring_get_irq(struct intel_ring_buffer *ring)
1358{
1359	return gen6_ring_get_irq(ring,
1360				 GT_BLT_USER_INTERRUPT,
1361				 GEN6_BLITTER_USER_INTERRUPT);
1362}
1363
1364static void
1365blt_ring_put_irq(struct intel_ring_buffer *ring)
1366{
1367	gen6_ring_put_irq(ring,
1368			  GT_BLT_USER_INTERRUPT,
1369			  GEN6_BLITTER_USER_INTERRUPT);
1370}
1371
1372
1373/* Workaround for some stepping of SNB,
1374 * each time when BLT engine ring tail moved,
1375 * the first command in the ring to be parsed
1376 * should be MI_BATCH_BUFFER_START
1377 */
1378#define NEED_BLT_WORKAROUND(dev) \
1379	(IS_GEN6(dev) && (dev->pdev->revision < 8))
1380
1381static inline struct drm_i915_gem_object *
1382to_blt_workaround(struct intel_ring_buffer *ring)
1383{
1384	return ring->private;
1385}
1386
1387static int blt_ring_init(struct intel_ring_buffer *ring)
1388{
1389	if (NEED_BLT_WORKAROUND(ring->dev)) {
1390		struct drm_i915_gem_object *obj;
1391		u32 *ptr;
1392		int ret;
1393
1394		obj = i915_gem_alloc_object(ring->dev, 4096);
1395		if (obj == NULL)
1396			return -ENOMEM;
1397
1398		ret = i915_gem_object_pin(obj, 4096, true);
1399		if (ret) {
1400			drm_gem_object_unreference(&obj->base);
1401			return ret;
1402		}
1403
1404		ptr = kmap(obj->pages[0]);
1405		*ptr++ = MI_BATCH_BUFFER_END;
1406		*ptr++ = MI_NOOP;
1407		kunmap(obj->pages[0]);
1408
1409		ret = i915_gem_object_set_to_gtt_domain(obj, false);
1410		if (ret) {
1411			i915_gem_object_unpin(obj);
1412			drm_gem_object_unreference(&obj->base);
1413			return ret;
1414		}
1415
1416		ring->private = obj;
1417	}
1418
1419	return init_ring_common(ring);
1420}
1421
1422static int blt_ring_begin(struct intel_ring_buffer *ring,
1423			  int num_dwords)
1424{
1425	if (ring->private) {
1426		int ret = intel_ring_begin(ring, num_dwords+2);
1427		if (ret)
1428			return ret;
1429
1430		intel_ring_emit(ring, MI_BATCH_BUFFER_START);
1431		intel_ring_emit(ring, to_blt_workaround(ring)->gtt_offset);
1432
1433		return 0;
1434	} else
1435		return intel_ring_begin(ring, 4);
1436}
1437
1438static int blt_ring_flush(struct intel_ring_buffer *ring,
1439			  u32 invalidate, u32 flush)
1440{
1441	uint32_t cmd;
1442	int ret;
1443
1444	ret = blt_ring_begin(ring, 4);
1445	if (ret)
1446		return ret;
1447
1448	cmd = MI_FLUSH_DW;
1449	if (invalidate & I915_GEM_DOMAIN_RENDER)
1450		cmd |= MI_INVALIDATE_TLB;
1451	intel_ring_emit(ring, cmd);
1452	intel_ring_emit(ring, 0);
1453	intel_ring_emit(ring, 0);
1454	intel_ring_emit(ring, MI_NOOP);
1455	intel_ring_advance(ring);
1456	return 0;
1457}
1458
1459static void blt_ring_cleanup(struct intel_ring_buffer *ring)
1460{
1461	if (!ring->private)
1462		return;
1463
1464	i915_gem_object_unpin(ring->private);
1465	drm_gem_object_unreference(ring->private);
1466	ring->private = NULL;
1467}
1468
1469static const struct intel_ring_buffer gen6_blt_ring = {
1470	.name			= "blt ring",
1471	.id			= RING_BLT,
1472	.mmio_base		= BLT_RING_BASE,
1473	.size			= 32 * PAGE_SIZE,
1474	.init			= blt_ring_init,
1475	.write_tail		= ring_write_tail,
1476	.flush			= blt_ring_flush,
1477	.add_request		= gen6_add_request,
1478	.get_seqno		= gen6_ring_get_seqno,
1479	.irq_get		= blt_ring_get_irq,
1480	.irq_put		= blt_ring_put_irq,
1481	.dispatch_execbuffer	= gen6_ring_dispatch_execbuffer,
1482	.cleanup		= blt_ring_cleanup,
1483	.sync_to		= gen6_blt_ring_sync_to,
1484	.semaphore_register	= {MI_SEMAPHORE_SYNC_BR,
1485				   MI_SEMAPHORE_SYNC_BV,
1486				   MI_SEMAPHORE_SYNC_INVALID},
1487	.signal_mbox		= {GEN6_RBSYNC, GEN6_VBSYNC},
1488};
1489
1490int intel_init_render_ring_buffer(struct drm_device *dev)
1491{
1492	drm_i915_private_t *dev_priv = dev->dev_private;
1493	struct intel_ring_buffer *ring = &dev_priv->ring[RCS];
1494
1495	*ring = render_ring;
1496	if (INTEL_INFO(dev)->gen >= 6) {
1497		ring->add_request = gen6_add_request;
1498		ring->flush = gen6_render_ring_flush;
1499		ring->irq_get = gen6_render_ring_get_irq;
1500		ring->irq_put = gen6_render_ring_put_irq;
1501		ring->get_seqno = gen6_ring_get_seqno;
1502	} else if (IS_GEN5(dev)) {
1503		ring->add_request = pc_render_add_request;
1504		ring->get_seqno = pc_render_get_seqno;
1505	}
1506
1507	if (!I915_NEED_GFX_HWS(dev)) {
1508		ring->status_page.page_addr = dev_priv->status_page_dmah->vaddr;
1509		memset(ring->status_page.page_addr, 0, PAGE_SIZE);
1510	}
1511
1512	return intel_init_ring_buffer(dev, ring);
1513}
1514
1515int intel_render_ring_init_dri(struct drm_device *dev, u64 start, u32 size)
1516{
1517	drm_i915_private_t *dev_priv = dev->dev_private;
1518	struct intel_ring_buffer *ring = &dev_priv->ring[RCS];
1519
1520	*ring = render_ring;
1521	if (INTEL_INFO(dev)->gen >= 6) {
1522		ring->add_request = gen6_add_request;
1523		ring->irq_get = gen6_render_ring_get_irq;
1524		ring->irq_put = gen6_render_ring_put_irq;
1525	} else if (IS_GEN5(dev)) {
1526		ring->add_request = pc_render_add_request;
1527		ring->get_seqno = pc_render_get_seqno;
1528	}
1529
1530	if (!I915_NEED_GFX_HWS(dev))
1531		ring->status_page.page_addr = dev_priv->status_page_dmah->vaddr;
1532
1533	ring->dev = dev;
1534	INIT_LIST_HEAD(&ring->active_list);
1535	INIT_LIST_HEAD(&ring->request_list);
1536	INIT_LIST_HEAD(&ring->gpu_write_list);
1537
1538	ring->size = size;
1539	ring->effective_size = ring->size;
1540	if (IS_I830(ring->dev))
1541		ring->effective_size -= 128;
1542
1543	ring->map.offset = start;
1544	ring->map.size = size;
1545	ring->map.type = 0;
1546	ring->map.flags = 0;
1547	ring->map.mtrr = 0;
1548
1549	drm_core_ioremap_wc(&ring->map, dev);
1550	if (ring->map.handle == NULL) {
1551		DRM_ERROR("can not ioremap virtual address for"
1552			  " ring buffer\n");
1553		return -ENOMEM;
1554	}
1555
1556	ring->virtual_start = (void __force __iomem *)ring->map.handle;
1557	return 0;
1558}
1559
1560int intel_init_bsd_ring_buffer(struct drm_device *dev)
1561{
1562	drm_i915_private_t *dev_priv = dev->dev_private;
1563	struct intel_ring_buffer *ring = &dev_priv->ring[VCS];
1564
1565	if (IS_GEN6(dev) || IS_GEN7(dev))
1566		*ring = gen6_bsd_ring;
1567	else
1568		*ring = bsd_ring;
1569
1570	return intel_init_ring_buffer(dev, ring);
1571}
1572
1573int intel_init_blt_ring_buffer(struct drm_device *dev)
1574{
1575	drm_i915_private_t *dev_priv = dev->dev_private;
1576	struct intel_ring_buffer *ring = &dev_priv->ring[BCS];
1577
1578	*ring = gen6_blt_ring;
1579
1580	return intel_init_ring_buffer(dev, ring);
1581}